Busca no site da UFMG

Nº 1847 - Ano 40
02.12.2013


Achando agulha no palheiro

DCC e Serpro aplicam mineração de dados para extrair informações governamentais; tecnologia será licenciada por meio de edital de oferta pública

Luana Macieira

Oferecer acesso a dados governamentais é uma exigência que recai sobre os órgãos públicos. Para atender a essa demanda de transparência e buscar informações “escondidas” nos bancos de dados federais, um projeto do Departamento de Ciência da Computação (DCC) da UFMG, em parceria com o Serviço Federal de Processamento de Dados (Serpro), utiliza as ferramentas de mineração de dados para acelerar a extração e o acesso às informações governamentais.

Segundo Wagner Meira Júnior, professor do DCC e um dos coordenadores do projeto Práticas de mineração de dados escaláveis para sistemas de governo, a tecnologia é importante porque as unidades gestoras dos serviços públicos federais lidam com informações muito volumosas, complexas e diversificadas. “Essa tecnologia pode identificar as boas práticas já desenvolvidas na gestão governamental, ou seja, aquelas que levam à economia, à racionalização e à melhoria dos processos. Reconhecendo essas práticas é possível ampliá-las para outras organizações e esferas, como a municipal e a estadual, uma vez que o projeto foca seus esforços, em um primeiro momento, apenas no âmbito federal”, explica o professor.

A mineração de dados usa algoritmos capazes de determinar padrões ou modelos que possibilitam, por exemplo, encontrar, em meio a um universo quase infinito de informações, aquelas que são úteis para certa atividade. Para um projeto que lida especificamente com dados do governo federal, Meira explica que foram analisados e minerados bancos de dados reais e que isso possibilita a detecção de futuras anormalidades nos sistemas.

“As técnicas de mineração exigem a adoção de certos parâmetros e configurações. Para a elaboração do software, foi necessário fazer muitas análises sobre as bases de dados reais do governo. Além disso, como a mineração modela o comportamento normal que deveria se esperar de um banco de dados e como um sistema deveria agir, qualquer anormalidade ou tentativa de fraude tem probabilidade maior de ser detectada”, argumenta Wagner Meira.

Depois que a tecnologia for transferida para as empresas interessadas em desenvolver processos usando o software livre desenvolvido pela parceria entre UFMG e Serpro, Meira destaca que a possível próxima etapa dos estudos vai ampliar o uso da mineração de dados para outras bases governamentais.

“Existe uma grande base de dados federal, a partir da qual todas as notas fiscais eletrônicas são emitidas no país. Pretendemos desenvolver novos processos e algoritmos nessa área para facilitar um melhor entendimento desse tipo de dado”, adianta o pesquisador do DCC

Sem exclusividade

O projeto teve como ponto de partida um software livre (Tamanduá), ferramenta que permite que qualquer pessoa possa alterá-lo, estendê-lo e utilizá-lo, sem a necessidade de ressarcimento. A novidade na transferência de sua tecnologia reside no fato de que os acordos serão firmados com empresas interessadas em desenvolver processos para o seu uso. “Os processos, e não o software, é que serão objeto da transferência de tecnologia”, destaca Meira.

O edital de licenciamento da ferramenta foi lançado na última quinta-feira, dia 28. O processo, conduzido pela Coordenadoria de Transferência e Inovação Tecnológica (CTIT), prevê a exploração na modalidade de oferta pública e sem exclusividade, o que permite que várias empresas adquiram o direito de uso e aprimoramento da tecnologia.

Propostas devem ser enviadas até 10 de janeiro, e as empresas selecionadas serão anunciadas em 30 de janeiro. O edital prevê, ainda, critérios mínimos a serem cumpridos pelos interessados em explorar a tecnologia, como dispor de equipe técnica capacitada e comprovada experiência em desenvolvimento de pesquisas.