Universidade Federal de Minas Gerais

Foca Lisboa/UFMG
Meira_2011.JPG
Wagner Meira Jr: técnicas para extrair o que realmente importa

Pesquisas do DCC criam algoritmos para ‘garimpar’ informações na internet

segunda-feira, 24 de junho de 2013, às 6h01

Com a volumosa quantidade de dados disponibilizados na internet, o desenvolvimento de ferramentas para obter as informações que realmente interessam é cada vez mais estratégico. Esse é um dos focos de estudos de um grupo de pesquisadores do Departamento de Ciência da Computação da UFMG (DCC).

Conhecido como “mineração de dados”, esse campo de investigação busca extrair informações ou padrões relevantes a partir de grandes volumes de dados. Segundo o professor do DCC Wagner Meira Jr, o trabalho de mineração de dados é impossível de ser feito manualmente e, por isso, o desenvolvimento de técnicas para que as informações sejam filtradas na internet e em outras redes é essencial.

“As informações que a mineração de dados busca são aquelas úteis, novas e que estavam implícitas e escondidas nos próprios dados. No caso da internet, que envolve uma quantidade gigantesca de informações, esse trabalho é muito importante”, explica.

O trabalho com mineração de dados é complexo por dois motivos. Em primeiro lugar, a natureza da informação, chamada pelos pesquisadores de “padrão”, pode não ser muito clara. Um padrão básico em mineração de dados é uma regra, e o desafio inicial das pesquisas sobre o assunto é defini-lo. A segunda dificuldade enfrentada pelos estudiosos do assunto é que, uma vez definido esse padrão, é preciso decidir como esse volume de dados disponível será trabalhado.

Entre os estudos desenvolvidos na UFMG nesse campo, o professor Wagner Meira Jr. destaca a dissertação de mestrado defendida pelo pesquisador Arlei Silva, que agora está cursando doutorado na Universidade da Califórnia. Intitulado Structural correlation pattern mining for large graphs, o trabalho do estudante compreendeu o projeto, o desenvolvimento e a aplicação de novos algoritmos e técnicas para que informações inesperadas surgissem por meio de dados obtidos em redes.

A pesquisa teve dois momentos principais. De início, para resolver o problema da dificuldade em definir padrões, Arlei propôs a criação de novo padrão, chamado de “correlação estrutural”. A partir daí, foram desenvolvidas técnicas baseadas em amostragem de dados para extrair os padrões de forma eficiente.

“Essa pesquisa definiu um novo tipo de padrão e, a partir dele, foi desenvolvido um conjunto de técnicas que tornam a mineração viável para uma base de dados reais. Com os algoritmos criados por Arlei, o processo de extrair um novo tipo de informação útil de uma grande base de dados se tornou extremamente prático”, aponta Meira.

Laços e conexões
A “correlação estrutural” parte de uma constatação simples: em um mundo extremamente conectado, em que as pessoas têm acesso ilimitado à internet e às redes sociais, são criados laços entre elas. As redes que se formam por conexões entre as pessoas precisam ser entendidas, e essa é uma das tarefas da mineração de dados, por meio de seus padrões e algoritmos.

“O padrão de correlação estrutural leva em conta a estrutura da rede e o conteúdo associado aos seus nós. No caso de uma rede social, os nós são os pontos de encontro entre as pessoas, os atributos e as suas características, e a rede representa as relações entre elas”, explica Wagner Meira Jr.

Um exemplo dado pelo professor é a rede da qual fazem parte os pesquisadores que participam do Instituto Nacional de Ciência e Tecnologia para a Web (InWeb), grupo de pesquisa com sede no DCC que tem a internet como foco de seus estudos.

“Em uma rede de coautoria de artigos dos pesquisadores integrantes do InWeb, se você agrega os títulos de artigos escritos por eles e aplica o algoritmo desenvolvido na pesquisa de mestrado, é possível separar a informação de forma muito interessante, pois a visualização de quais autores têm relação com determinados temas se torna evidente. Vê-se claramente com quem cada pesquisador está de fato ligado”, diz.

Busca social
O sistema de mineração de dados está presente também nas redes sociais. No Facebook, por exemplo, o usuário se relaciona com amigos, colegas de trabalho e familiares. Para facilitar a vida desse usuário, o facebook criou a “busca social”, modalidade de mineração de dados.

“Com o uso de padrões e algoritmos, o Facebook sugere aos usuários pessoas que ele deve adicionar a sua rede social. Os algoritmos conseguem mostrar que há pessoas que poderiam, devido às suas conexões, fazer parte também das relações do usuário que recebe as sugestões. A mineração de dados segmenta as redes”, conclui Wagner Meira Jr.

(Luana Macieira)

05/set, 13h24 - Coral da OAP se apresenta no Conservatório, nesta quarta

05/set, 13h12 - Grupo de 'drag queens' evoca universo LGBT em show amanhã, na Praça de Serviços

05/set, 12h48 - 'Domingo no campus': décima edição em galeria de fotos

05/set, 9h24 - Faculdade de Medicina promove semana de prevenção ao suicídio

05/set, 9h18 - Pesquisador francês fará conferência sobre processos criativos na próxima semana

05/set, 9h01 - Encontro reunirá pesquisadores da memória e da história da UFMG

05/set, 8h17 - Sessões do CineCentro em setembro têm musical, comédia e ficção científica

05/set, 8h10 - Concerto 'Jovens e apaixonados' reúne obras de Mozart nesta noite, no Conservatório

04/set, 11h40 - Adriana Bogliolo toma posse como vice-diretora da Ciência da Informação

04/set, 8h45 - Nova edição do Boletim é dedicada aos 90 anos da UFMG

04/set, 8h34 - Pesquisador francês aborda diagnóstico de pressão intracraniana por meio de teste audiológico em palestra na Medicina

04/set, 8h30 - Acesso à justiça e direito infantojuvenil reúnem especialistas na UFMG neste mês

04/set, 7h18 - No mês de seu aniversário, Rádio UFMG Educativa tem programação especial

04/set, 7h11 - UFMG seleciona candidatos para cursos semipresenciais em gestão pública

04/set, 7h04 - Ensino e inclusão de pessoas com deficiência no meio educacional serão discutidos em congresso

Classificar por categorias (30 textos mais recentes de cada):
Artigos
Calouradas
Conferência das Humanidades
Destaques
Domingo no Campus
Eleições Reitoria
Encontro da AULP
Entrevistas
Eschwege 50 anos
Estudante
Eventos
Festival de Inverno
Festival de Verão
Gripe Suína
Jornada Africana
Libras
Matrícula
Mostra das Profissões
Mostra das Profissões 2009
Mostra das Profissões e UFMG Jovem
Mostra Virtual das Profissões
Notas à Comunidade
Notícias
O dia no Campus
Participa UFMG
Pesquisa
Pesquisa e Inovação
Residência Artística Internacional
Reuni
Reunião da SBPC
Semana de Saúde Mental
Semana do Conhecimento
Semana do Servidor
Seminário de Diamantina
Sisu
Sisu e Vestibular
Sisu e Vestibular 2016
UFMG 85 Anos
UFMG 90 anos
UFMG, meu lugar
Vestibular
Volta às aulas

Arquivos mensais:
outubro de 2017 (1)
setembro de 2017 (33)
agosto de 2017 (206)
julho de 2017 (127)
junho de 2017 (171)
maio de 2017 (192)
abril de 2017 (133)
março de 2017 (205)
fevereiro de 2017 (142)
janeiro de 2017 (109)
dezembro de 2016 (108)
novembro de 2016 (141)
outubro de 2016 (229)
setembro de 2016 (219)
agosto de 2016 (188)
julho de 2016 (176)
junho de 2016 (213)
maio de 2016 (208)
abril de 2016 (177)
março de 2016 (236)
fevereiro de 2016 (138)
janeiro de 2016 (131)
dezembro de 2015 (148)
novembro de 2015 (214)
outubro de 2015 (256)
setembro de 2015 (195)
agosto de 2015 (209)
julho de 2015 (184)
junho de 2015 (225)
maio de 2015 (248)
abril de 2015 (215)
março de 2015 (224)
fevereiro de 2015 (170)

Expediente