Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/11123
Título: Estimativas de Comportamento Vocálico de Locutores e Um Novo Sistema de Separação Silábica
Autor(es): Silva, Elda Lizandra Fernandes da
Palavras-chave: Caracterização de Voz; Pitch; Sons Vocálicos; Divisão Silábica; Língua Portuguesa; Processamento de Fala; Conversão Fala-para-texto
Data do documento: 28-Mai-2012
Editor: Universidade Federal de Pernambuco
Citação: SILVA, Elda Lizandra Fernandes da. Estimativas de comportamento vocálico de locutores e um novo sistema de separação silábica. Recife, 2012. xii, 150 folhas : Dissertação (mestrado) - Universidade Federal de Pernambuco. CTG. Programa de Pós-Graduação em Engenharia Elétrica, 2012.
Resumo: Nesta dissertação um método simples para a estimação automática do comportamento espectral de trechos vocálicos de locutores é proposto. Uma implementação computacional em Matlab® é apresentada e sua validação é conduzida comparando os resultados com uma identificação realizada manualmente, empregando o Audacity 1.3®. Locutores (masculinos e femininos) foram considerados e os testes foram conduzidos para sete diferentes sons vocálicos da língua portuguesa (a, é, ê, i, ó, ô, u). A abordagem é potencialmente útil em modelos de trato vocal, na melhoria da qualidade de sintetizadores de voz ou em algoritmos de reconhecimento automático de locutor. Em uma segunda parte, um novo algoritmo para divisão silábica automática de arquivos de voz na língua portuguesa é proposto, com base na envoltória do sinal de voz. Uma implementação computacional em Matlab® é apresentada, a qual encontra-se disponibilizada na URL http://www2.ee.ufpe.br/codec/divisao_silabica.html. Trechos longos contendo mais de uma sílaba e identificados com uma mesma envoltória são chamados de supersilabas e são separados posteriormente. Os resultados identificam as amostras correspondentes ao início e o fim de cada sílaba detectada. Foram realizados testes preliminares com meia centena de palavras, com uma taxa de identificação de cerca de 70%, porém melhorias podem ser incorporadas para tratar fonemas nos quais o envelope não é o principal parâmetro na identificação. Este algoritmo também pode ser particularmente útil em sistemas com comandos de voz ou como ferramenta de apoio no ensino da língua portuguesa ou para pacientes em tratamento fonoaudiológico.
URI: https://repositorio.ufpe.br/handle/123456789/11123
Aparece na(s) coleção(ções):Dissertações de Mestrado - Engenharia Elétrica

Arquivos deste item:
Arquivo Descrição TamanhoFormato 
Dissertacao_Elda.pdf7,84 MBAdobe PDFVer/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons