Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/49952
Share on
| Título : | Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa |
| Autor : | LIMA, Pedro Manoel Farias Sena de |
| Palabras clave : | Processamento de linguagem natural; Modelos de linguagem; BERT; Similaridade semântica; Inferência textual |
| Fecha de publicación : | 4-may-2023 |
| Citación : | LIMA, Pedro Manoel Farias Sena de. Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa. 2023. 25 f. TCC (Graduação) - Curso de Sistemas de Informação, Centro de Informática, Universidade Federal de Pernambuco, Recife, 2023. |
| Resumen : | Os avanços na área de processamento de linguagem natural permitiram o surgimento de modelos de linguagem mais eficientes e capazes de atingir o estado da arte dentro dessa área. Porém, esses avanços representam quase que exclusivamente modelos que utilizam o inglês como sua língua principal. Em relação a outras línguas, como o português, esses avanços não seguem o mesmo ritmo. O seguinte trabalho busca realizar uma análise comparativa de métodos de modelos de linguagem capazes de utilizar a língua portuguesa, e para isso foram utilizados dois modelos, o BERT (do inglês, Bidirectional Encoder Representation from Transformers) e o BERTimbau, modelo baseado no BERT treinado para o português. A avaliação dos modelos foi feita utilizando a base de dados ASSIN 2. Os resultados mostraram que o BERTimbau atingiu uma melhor performance nas tarefas de similaridade semântica, com uma correlação de Pearson de 0,8433, e inferência textual com um F1-score de 0,886. |
| URI : | https://repositorio.ufpe.br/handle/123456789/49952 |
| Aparece en las colecciones: | (TCC) - Sistemas da Computação |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| TCC Pedro Manoel Farias Sena de Lima.pdf | 655.43 kB | Adobe PDF | ![]() Visualizar/Abrir |
Este ítem está protegido por copyright original |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons

