Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufpe.br/handle/123456789/11123
Comparte esta pagina
Título : | Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica |
Autor : | Silva, Elda Lizandra Fernandes da |
Palabras clave : | Caracterização de Voz; Pitch; Sons Vocálicos; Divisão Silábica; Língua Portuguesa; Processamento de Fala; Conversão Fala-para-texto |
Fecha de publicación : | 28-may-2012 |
Editorial : | Universidade Federal de Pernambuco |
Citación : | SILVA, Elda Lizandra Fernandes da. Estimativas de comportamento vocálico de locutores e um novo sistema de separação silábica. Recife, 2012. xii, 150 folhas : Dissertação (mestrado) - Universidade Federal de Pernambuco. CTG. Programa de Pós-Graduação em Engenharia Elétrica, 2012. |
Resumen : | Nesta dissertação um método simples para a estimação automática do comportamento espectral de trechos vocálicos de locutores é proposto. Uma implementação computacional em Matlab® é apresentada e sua validação é conduzida comparando os resultados com uma identificação realizada manualmente, empregando o Audacity 1.3®. Locutores (masculinos e femininos) foram considerados e os testes foram conduzidos para sete diferentes sons vocálicos da língua portuguesa (a, é, ê, i, ó, ô, u). A abordagem é potencialmente útil em modelos de trato vocal, na melhoria da qualidade de sintetizadores de voz ou em algoritmos de reconhecimento automático de locutor. Em uma segunda parte, um novo algoritmo para divisão silábica automática de arquivos de voz na língua portuguesa é proposto, com base na envoltória do sinal de voz. Uma implementação computacional em Matlab® é apresentada, a qual encontra-se disponibilizada na URL http://www2.ee.ufpe.br/codec/divisao_silabica.html. Trechos longos contendo mais de uma sílaba e identificados com uma mesma envoltória são chamados de supersilabas e são separados posteriormente. Os resultados identificam as amostras correspondentes ao início e o fim de cada sílaba detectada. Foram realizados testes preliminares com meia centena de palavras, com uma taxa de identificação de cerca de 70%, porém melhorias podem ser incorporadas para tratar fonemas nos quais o envelope não é o principal parâmetro na identificação. Este algoritmo também pode ser particularmente útil em sistemas com comandos de voz ou como ferramenta de apoio no ensino da língua portuguesa ou para pacientes em tratamento fonoaudiológico. |
URI : | https://repositorio.ufpe.br/handle/123456789/11123 |
Aparece en las colecciones: | Dissertações de Mestrado - Engenharia Elétrica |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Dissertacao_Elda.pdf | 7,84 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons