Reconhecimento de fala em tempo real para robôs móveis

HUAMPO, Eulogio Gutierrez

Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/37902

Share on

Title:	Reconhecimento de fala em tempo real para robôs móveis
Authors:	HUAMPO, Eulogio Gutierrez
Keywords:	Inteligência computacional; Reconhecimento de fala
Issue Date:	27-Mar-2020
Publisher:	Universidade Federal de Pernambuco
Citation:	HUAMPO, Eulogio Gutierrez. Reconhecimento de fala em tempo real para robôs móveis. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2020.
Abstract:	O reconhecimento de fala para robôs é um campo multidisciplinar que envolve processamento de sinais e novos modelos de aprendizagem de máquina. Entre suas aplicações, podemos citar o controle de uma cadeira de rodas por comandos de voz, para ajudar pessoas com restrições de mobilidade. O objetivo deste trabalho é propor e implementar modelos de reconhecimento de comandos de voz em tempo real, fazendo ênfase em aprendizagem on-line e a integração ao robô TIAGo, a fim de executar tarefas de navegação. Modelos independentes do locutor são implementados baseados numa nova base de dados de vocabulário limitado, o extrator de características MFCC e a implementação das redes neurais MLP e oiSGNG, que vem do inglês online incremental Supervised Growing Neural Gas, para os quais no treinamento emprega-se a adição de ruído branco e colorido para melhorar seu desempenho. Nos resultados, em termos de taxa de acertos e tempo de processamento, o melhor caso é o MLP, mas requer alterar a estrutura e ajustar os parâmetros para aprender novas categorias. Por outro lado, o classificador oiSGNG não tem esses problemas. Neste caso, apresentamos duas contribuições: (i) nodos inseridos de acordo a uma função exponencial, desse jeito, gera-se uma taxa de acertos mais alta com menos nodos, o que implica menor latência; (ii) aprendizagem on-line de comandos de voz, uma nova implementação, o modelo aprende novos comandos ao mesmo tempo em que os grava. Nos experimentos, a navegação do robô é efetuada via comandos de voz, isto é, movimento da base do robô através dos comandos de velocidade. Para evitar positivos falsos e interferência do ambiente ruidoso, emprega-se uma palavra-chave associada ao comando, no caso do MLP empregamos limiar de ativação. Além disso, os modelos são avaliados para ambientes com ruído acústico, quer dizer, teste com adição de ruído de ventilador e ruído balbuciante. Em geral, a taxa de acertos é mais alta para os comandos gravados com detecção de som em tempo real e, a latência do processamento é menor que 15 ms, portanto, podemos concluir que o reconhecimento de comandos de voz é efetuado em tempo real.
URI:	https://repositorio.ufpe.br/handle/123456789/37902
Appears in Collections:	Dissertações de Mestrado - Ciência da Computação

Files in This Item:

File	Description	Size	Format
DISSERTAÇÃO Eulogio Gutierrez Huampo.pdf		3.51 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show full item record Recommend this item

This item is licensed under a Creative Commons License