Período da Residência: 01/08/2013 a 31/12/2014

Hani Camille Yehia é graduado em Engenharia Eletrônica (ITA, 1988), Mestre em Engenharia Eletrônica e Computação (ITA, 1992) e Doutor em Engenharia Elétrica (Universidade de Nagoya, Japão, 1997). Foi pesquisador dos laboratórios da ATR (Japão) de 1996 a 1998. Coordenou o Programa de Pós-Graduação em Eng. Elétrica de 2005 a 2009, o Conselho de Pós-Graduação da Escola de Engenharia da UFMG de 2007 a 2009 e a INOVA-UFMG (Incubadora de Empresas) de 2011 a 2013. É professor titular do Departamento de Engenharia Eletrônica da UFMG e Coordenador do CEFALA – Centro de Estudos da Fala, Acústica, Linguagem e Música, desenvolvendo pesquisa sobre produção e percepção audiovisual da Fala e da Música. Além disso, participa da coordenação do CEMECH – Centro de Estudos do Movimento, Expressão e Comportamento Humanos, realizando estudos sobre o movimento humano, tanto do ponto de vista de suas consequências gestuais (expressão), quanto do ponto de vista dos seus mecanismos subjacentes de produção (controle motor); e do CTPMag – Centro de Tecnologia e Pesquisa em Magneto-ressonância da UFMG. Em seus trabalhos, busca combinar pesquisa básica nas áreas de física, neurociência, linguística e música com pesquisa aplicada em tecnologia de codificação, reconhecimento e síntese audiovisual da fala e da Música.


TECNOLOGIA DA FALA APLICADA A MODELOS COGNITIVOS E SEUS CORRELATOS NEUROFISIOLÓGICOS

A fala, definida como a representação acústica da linguagem, desempenha um papel de ponte entre estudos de baixo nível focados na análise de sinais utilizados na transmissão e processamento da informação e estudos de alto nível que têm como alvo a interpretação dos símbolos que formam a base da comunicação humana. Neste contexto, este estudo busca desenvolver e utilizar ferramentas adequadas para a compreensão da fala a partir de diversos pontos de vista.

A primeira ferramenta mostra como é possível alinhar sistemas de coordenadas utilizados para representar sinais de natureza diferente, mas que possuam algum grau de dependência ou de acoplamento. Seu uso é exemplificado em Yehia, Rubin e Vatikiotis-Bateson (1998), onde analisam-se as relações existentes entre a geometria do trato vocal, o movimento da face e a acústica da fala.

Alinhar sistemas de coordenadas, entretanto, mostra-se insuficiente quando se estuda sinais cuja relação de dependência de um em relação ao outro possua um atraso que flutue ao longo do tempo. Para lidar com este tipo de caso, Barbosa, Vatikiotis-Bateson e Yehia (2012) mostram como mapas de correlação podem ser usados não apenas para medir o grau de acoplamento entre sinais, mas também a flutuação do atraso ao longo do tempo. Um exemplo de aplicação desta técnica é investigado em Teixeira, Loureiro, Wanderley e Yehia (2014), onde analisam-se as relações existentes entre aspectos acústicos e de movimento de performances musicais de clarinetistas.

Som e movimento são sinais relativamente fáceis de medir. Uma análise mais profunda da fala requer informações neurofisiológicas cuja medição representa um desafio. Técnicas de imagem, como a ressonância magnética funcional, permitem medições de resolução espacial elevada, da ordem de milímetros, mas de resolução temporal muito baixa, da ordem de minutos. Por outro lado, técnicas de medição de atividade elétrica no cérebro, como a eletroencefalografia de superfície, possuem elevada resolução temporal, da ordem de milissegundos, mas resolução espacial bastante pobre, uma vez que existem múltiplas distribuições internas de atividade no cérebro capazes de gerar um mesmo padrão de atividade elétrica de superfície. A combinação destas duas técnicas é analisada em Souza, Yehia, Sato e Callan (2013) onde realiza-se, de maneira pioneira, medições de plasticidade neural durante o processo de aprendizagem.

Finalmente, atenção deve ser dedicada à análise das relações existentes entre grandezas físicas objetivamente mensuráveis e seus correlatos perceptivos. Neste sentido, Vieira, Sansão e Yehia (2014) aplicam técnicas de processamento de imagem a espectrogramas para medir a relação harmônico-ruído de vozes disfônicas e, subsequentemente, estudar sua relação com a percepção de soprosidade na voz. Nesta mesma linha, Maia, Yehia e Errico (2015), realizam um levantamento das técnicas existentes para inferir a qualidade de experiência com base em parâmetros extraídos de sinais de ídeo.

Em síntese, os trabalhos realizados podem ser vistos como algumas das peças de um grande quebra-cabeças capaz de representar a fala humana, tanto como sinais fisicamente mensuráveis, quanto como símbolos nos quais a comunicação humana está baseada.