Aqui tem ciência – episódio 190
Processamento de linguagem natural (PLN) é uma vertente da inteligência artificial que ajuda computadores a entender, interpretar e manipular a linguagem humana. A capacidade de representar palavras de maneira significativa e eficiente é crucial para as aplicações de PLN, pois isso afeta de forma significativa os métodos de machine learning (aprendizado de máquina, em tradução livre).
O cientista de dados Felipe Augusto Resende Viegas projetou uma nova representação de documentos que agrupa palavras semanticamente relacionadas, as CluWords, para mitigar interpretações equivocadas de sentenças que podem prejudicar o aprendizado de máquina. O estudo, realizado no Programa de Pós-Graduação em Ciência da Computação da UFMG, é tema do novo episódio do ‘Aqui tem Ciência’.