Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/11123
Title: Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica
Authors: Silva, Elda Lizandra Fernandes da
Keywords: Caracterização de Voz;Pitch;Sons Vocálicos;Divisão Silábica;Língua Portuguesa;Processamento de Fala;Conversão Fala-para-texto
Issue Date: 28-May-2012
Publisher: Universidade Federal de Pernambuco
Citation: SILVA, Elda Lizandra Fernandes da. Estimativas de comportamento vocálico de locutores e um novo sistema de separação silábica. Recife, 2012. xii, 150 folhas : Dissertação (mestrado) - Universidade Federal de Pernambuco. CTG. Programa de Pós-Graduação em Engenharia Elétrica, 2012.
Abstract: Nesta dissertação um método simples para a estimação automática do comportamento espectral de trechos vocálicos de locutores é proposto. Uma implementação computacional em Matlab® é apresentada e sua validação é conduzida comparando os resultados com uma identificação realizada manualmente, empregando o Audacity 1.3®. Locutores (masculinos e femininos) foram considerados e os testes foram conduzidos para sete diferentes sons vocálicos da língua portuguesa (a, é, ê, i, ó, ô, u). A abordagem é potencialmente útil em modelos de trato vocal, na melhoria da qualidade de sintetizadores de voz ou em algoritmos de reconhecimento automático de locutor. Em uma segunda parte, um novo algoritmo para divisão silábica automática de arquivos de voz na língua portuguesa é proposto, com base na envoltória do sinal de voz. Uma implementação computacional em Matlab® é apresentada, a qual encontra-se disponibilizada na URL http://www2.ee.ufpe.br/codec/divisao_silabica.html. Trechos longos contendo mais de uma sílaba e identificados com uma mesma envoltória são chamados de supersilabas e são separados posteriormente. Os resultados identificam as amostras correspondentes ao início e o fim de cada sílaba detectada. Foram realizados testes preliminares com meia centena de palavras, com uma taxa de identificação de cerca de 70%, porém melhorias podem ser incorporadas para tratar fonemas nos quais o envelope não é o principal parâmetro na identificação. Este algoritmo também pode ser particularmente útil em sistemas com comandos de voz ou como ferramenta de apoio no ensino da língua portuguesa ou para pacientes em tratamento fonoaudiológico.
URI: https://repositorio.ufpe.br/handle/123456789/11123
Appears in Collections:Dissertações de Mestrado - Engenharia Elétrica

Files in This Item:
File Description SizeFormat 
Dissertacao_Elda.pdf7.84 MBAdobe PDFView/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons