Busca no site da UFMG

Nº 1869 - Ano 40
28.07.2014

Encarte

Dos fundamentos ao estado da arte

Professores do DCC e de instituto dos EUA lançam livro com abordagem ampliada da mineração de dados

Pedro Nogueira

Big data é uma das expressões da moda no mercado da tecnologia, usada para descrever grandes quantidades de dados, fornecidos em altas velocidades, originados de fontes muito diversas e que podem ser utilizados para uma infinidade de análises e estimativas. Sob a perspectiva acadêmica, Data Science (ou Ciência dos Dados) tem surgido como uma visão mais sistemática e robusta dos modelos e estratégias que buscam extrair conhecimento de grandes volumes de dados.

Uma das principais áreas ligadas à Data Science, a mineração de dados, que compreende métodos, processos e técnicas para extrair informações de conjuntos complexos de dados, acaba de ganhar uma obra acadêmica que pode se tornar referência para alunos de graduação e pós-graduação interessados nesse campo de investigação: Data mining and analysis: fundamental concepts and algorithms, escrito pelos professores Mohammed Zaki, do Rensselaer Polytechnic Institute, nos Estados Unidos, e Wagner Meira Jr., do Departamento de Ciência da Computação da UFMG.

Segundo Zaki, faltam obras nessa área: “A ideia foi padronizar terminologias e explicar todo o processo sem intuir que o leitor já conheça as bases teóricas, tais como álgebra linear, matemática discreta e estatística, entre outras. Nosso objetivo foi cobrir todos os fundamentos, além do estado da arte da área e suas novidades”, explica o professor. O livro foi escrito ao longo de oito anos, concomitantemente a cursos ministrados pelos dois pesquisadores nas instituições de origem.

Área naturalmente multidisciplinar, a mineração de dados reúne conceitos de Matemática, Estatística e Ciência da Computação, incluindo computação de alta performance, visualização de dados e aprendizado de máquina. Sua aplicação se estende por uma gama ainda maior de campos, como Astronomia, Biologia, Ciências Sociais e Humanidades, entre outros. Grande parte do desenvolvimento científico das várias áreas que compõem a Ciência dos Dados está na criação de algoritmos inovadores.

Modelo inovador de distribuição

Além do objetivo de estabelecer as bases de ensino para os cursos iniciais, o livro também explora experiências diferenciadas em sua própria distribuição. O professor Wagner Meira Jr. afirma que a pirataria na internet era uma das maiores preocupações ao lançar o livro. Além disso, os estudantes poderiam ter dificuldades financeiras em adquirir um material de referência. Assim, os autores optaram por uma licença editorial que permite manter uma cópia do livro disponível para download.

Esse opção inibe os piratas, já que os usuários podem ter acesso ao conteúdo original e completo a qualquer tempo, diretamente de uma fonte autorizada. Resultado: antes mesmo do lançamento, o livro já havia sido baixado mais de 102 mil vezes em 159 países. “Para um livro técnico, vender mais de dez mil cópias é pouco comum. De qualquer forma, o número de downloads ultrapassou nossa expectativa de vendas do livro. Vamos esperar, agora, para conferir o impacto dessa estratégia em termos de vendas e repercussão, como citações”, afirma Meira.

Durante a produção da publicação, os autores contaram com o apoio das agências NSF, CNPq e Fapemig, e do Instituto Nacional de Ciência e Tecnologia para a Web (InWeb). As visitas do professor Zaki à UFMG são financiadas pelo CNPq por meio do programa Ciência sem Fronteiras.

Lançamento

Aproveitando a presença do professor Zaki na UFMG, os autores vão lançar o livro no workshop Data Mining: theory and practice, no dia 5 de agosto a partir das 11h, no Auditório 3 do ICEx/UFMG. Na oportunidade, os dois professores vão proferir um seminário sobre o tema Data Science foundations for the information age. À tarde, haverá um painel sobre o tema Is there a difference or a convergence among Data Mining and other related areas?, com a presença de vários especialistas. Mais informações em http://www.inweb.org.br/workshop-data-mining-from-theory-to-practice/.

Livro: Data Mining and analysis: fundamental concepts and algorithms
Autores: Mohammed Zaki e Wagner Meira Jr.
Site para download: http://dataminingbook.info/
Sites para compra: http://www.cambridge.org/us/9780521766333 (Cambridge University Press) e Amazon.com (http://www.amazon.com/Data-Mining-Analysis-Fundamental-Algorithms/dp/0521766338/)