Período da Residência: 1º de agosto de 2016 a 31 de julho de 2017

Residente do IEAT, professor Alberto Henrique Frade Laender é graduado em Engenharia Elétrica pela Universidade Federal de Minas Gerais (1974), mestre em Ciência da Computação pela Universidade Federal de Minas Gerais (1979) e doutor em Computação pela University of East Anglia, Inglaterra (1984). Em 1997 foi pesquisador visitante no HP Labs em Palo Alto, California. Atualmente é Professor Titular do Departamento de Ciência da Computação da Universidade Federal de Minas Gerais, onde coordena o LBD – Laboratório de Bancos de Dados. Na UFMG, foi coordenador do Programa de Pós-Graduação em Ciência da Computação (1987-1989, 1993-1996), membro do Conselho de Ensino, Pesquisa e Extensão (2002-2005, 2010-2013) e chefe do Departamento de Ciência da Computação (2005-2006). Foi membro do Comitê Assessor de Ciência da Computação do CNPq em três oportunidades (1989-1990, 2003-2006, 2009-2012), tendo exercido a sua coordenação de setembro de 2010 a novembro de 2012. Foi também membro da Câmara de Assessoramento de Ciências Exatas e da Terra da FAPEMIG (1998-2000) e da Comissão de Avaliação Trienal da Área de Ciência da Computação da CAPES em 2007, 2010 e 2013. Desde 2008, vem atuando como assessor da Coordenação da Área de Ciência da Computação da CAPES. Foi um dos criadores do Journal of Information and Data Management, publicação oficial da Comissão Especial de Bancos de Dados da Sociedade Brasileira de Computação, e o seu primeiro Editor-Chefe. É membro do corpo editorial do Journal of Computing Science and Engineering editado pelo Korean Institute of Information Scientists and Engineers e da Revista de Informática Teórica e Aplicada editada pelo Instituto de Informática da UFRGS. Tem atuado também como membro do comitê de programa de importantes conferências internacionais nas áreas de bancos de dados, bibliotecas digitais e Web, sendo atualmente membro do Steering Committee da International Conference on Conceptual Modeling (ER), da ACM International Conference on Information and Knowledge Management (CIKM) e do Alberto Mendelzon International Workshop on Foundations of Data Management (AMW). Serviu ainda como membro do ACM SIGMOD Advisory Board (2005-2010) e do ACM SIGMOD Jim Gray Doctoral Dissertation Award Committee (2008-2011). É sócio-fundador da Sociedade Brasileira de Computação e Membro Titular da Academia Brasileira de Ciências (eleito em 2010) e da Academia Nacional de Engenharia (eleito em 2014). Em 2010 foi agraciado com a Ordem Nacional do Mérito Científico na classe Comendador. É sócio-fundador e membro do Conselho de Tecnologia da Zunnit Technologies, empresa sediada no Parque Tecnológico de Belo Horizonte e especializada em sistemas de recomendação. Foi também um dos fundadores da Akwan Information Technologies, empresa de tecnologia de busca adquirida pela Google Inc. em julho de 2005 para tornar-se o primeiro centro de desenvolvimento da empresa na América Latina. Suas principais áreas de atuação são bancos de dados, gerência de dados da Web, bibliotecas digitais e sistemas de informação para a Web.


PROJETO: ÁRVORES GENEALÓGICAS ACADÊMICAS: UM ESTUDO SOBRE A FORMAÇÃO, EVOLUÇÃO E DISSEMINAÇÃO DE GRUPOS DE PESQUISA

O projeto de pesquisa proposto, intitulado “Árvores Genealógicas Acadêmicas: Um Estudo sobre a Formação, Evolução e Disseminação de Grupos de Pesquisa”, tem por objetivo realizar um amplo estudo sobre a formação, evolução e disseminação de grupos de pesquisa nas mais diversas áreas do conhecimento a partir da construção, depuração e análise das árvores genealógicas acadêmicas de seus pesquisadores. Os dados coletados inicialmente para este projeto têm como fonte a Networked Library of Theses and Dissertatiosn (NDLTD), que é a maior e mais expressiva biblioteca digital de teses e dissertações existente e contém atualmente mais de 4 milhões de registros. Entretanto, apesar de adotar um padrão internacional de metadados, a NDLTD tem o seu conteúdo preenchido de forma totalmente descentralizada o que apresenta uma série de dificuldades para a extração consistente de dados. Entre os principais problemas encontrados estão a não adoção de formatos internacionais para o preenchimento de determinados campos ou a simples supressão de campos, o que faz com que um volume substancial dos registros não inclua de forma consistente os dados necessários para a construção das árvores genealógicas acadêmicas. Apesar desses problemas, a versão atual das árvores geradas tem como base 638.812 registros de teses e dissertações de instituição de todo o mundo, representando o maior esforço até então empreendido para estudar a genealogia acadêmica. Em função do exposto, os principais objetivos e resultados esperados deste projeto são: a) validar a versão atual das árvores geradas a partir de um estudo comparativo envolvendo dados de iniciativas similares; b) expandir o volume atual de árvores geradas reconstruindo os registros descartados da NDLTD a partir de dados provenientes de outras fontes. Em particular, no caso dos pesquisadores brasileiros, pretende-se utilizar dados a serem extraídos da plataforma Lattes; c) realizar uma ampla análise quantitativa e qualitativa das árvores geradas de modo a compreender como se dá a formação, evolução e disseminação dos grupos de pesquisa nas mais diversas áreas do conhecimento; d) disponibilizar os resultados do projeto por meio de website interativo que permita a exploração das árvores geradas e a obtenção de estatísticas e medidas que caracterizem a topologia dessas árvores.