Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica

Silva, Elda Lizandra Fernandes da

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/11123

Comparte esta pagina

Título :	Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica
Autor :	Silva, Elda Lizandra Fernandes da
Palabras clave :	Caracterização de Voz; Pitch; Sons Vocálicos; Divisão Silábica; Língua Portuguesa; Processamento de Fala; Conversão Fala-para-texto
Fecha de publicación :	28-may-2012
Editorial :	Universidade Federal de Pernambuco
Citación :	SILVA, Elda Lizandra Fernandes da. Estimativas de comportamento vocálico de locutores e um novo sistema de separação silábica. Recife, 2012. xii, 150 folhas : Dissertação (mestrado) - Universidade Federal de Pernambuco. CTG. Programa de Pós-Graduação em Engenharia Elétrica, 2012.
Resumen :	Nesta dissertação um método simples para a estimação automática do comportamento espectral de trechos vocálicos de locutores é proposto. Uma implementação computacional em Matlab® é apresentada e sua validação é conduzida comparando os resultados com uma identificação realizada manualmente, empregando o Audacity 1.3®. Locutores (masculinos e femininos) foram considerados e os testes foram conduzidos para sete diferentes sons vocálicos da língua portuguesa (a, é, ê, i, ó, ô, u). A abordagem é potencialmente útil em modelos de trato vocal, na melhoria da qualidade de sintetizadores de voz ou em algoritmos de reconhecimento automático de locutor. Em uma segunda parte, um novo algoritmo para divisão silábica automática de arquivos de voz na língua portuguesa é proposto, com base na envoltória do sinal de voz. Uma implementação computacional em Matlab® é apresentada, a qual encontra-se disponibilizada na URL http://www2.ee.ufpe.br/codec/divisao_silabica.html. Trechos longos contendo mais de uma sílaba e identificados com uma mesma envoltória são chamados de supersilabas e são separados posteriormente. Os resultados identificam as amostras correspondentes ao início e o fim de cada sílaba detectada. Foram realizados testes preliminares com meia centena de palavras, com uma taxa de identificação de cerca de 70%, porém melhorias podem ser incorporadas para tratar fonemas nos quais o envelope não é o principal parâmetro na identificação. Este algoritmo também pode ser particularmente útil em sistemas com comandos de voz ou como ferramenta de apoio no ensino da língua portuguesa ou para pacientes em tratamento fonoaudiológico.
URI :	https://repositorio.ufpe.br/handle/123456789/11123
Aparece en las colecciones:	Dissertações de Mestrado - Engenharia Elétrica

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
Dissertacao_Elda.pdf		7,84 MB	Adobe PDF	Visualizar/Abrir

Este ítem está protegido por copyright original

Visualizar la licencia

Mostrar el registro Dublin Core completo del ítem Recomiende este ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons