Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/49952

Share on

Title: Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa
Authors: LIMA, Pedro Manoel Farias Sena de
Keywords: Processamento de linguagem natural; Modelos de linguagem; BERT; Similaridade semântica; Inferência textual
Issue Date: 4-May-2023
Citation: LIMA, Pedro Manoel Farias Sena de. Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa. 2023. 25 f. TCC (Graduação) - Curso de Sistemas de Informação, Centro de Informática, Universidade Federal de Pernambuco, Recife, 2023.
Abstract: Os avanços na área de processamento de linguagem natural permitiram o surgimento de modelos de linguagem mais eficientes e capazes de atingir o estado da arte dentro dessa área. Porém, esses avanços representam quase que exclusivamente modelos que utilizam o inglês como sua língua principal. Em relação a outras línguas, como o português, esses avanços não seguem o mesmo ritmo. O seguinte trabalho busca realizar uma análise comparativa de métodos de modelos de linguagem capazes de utilizar a língua portuguesa, e para isso foram utilizados dois modelos, o BERT (do inglês, Bidirectional Encoder Representation from Transformers) e o BERTimbau, modelo baseado no BERT treinado para o português. A avaliação dos modelos foi feita utilizando a base de dados ASSIN 2. Os resultados mostraram que o BERTimbau atingiu uma melhor performance nas tarefas de similaridade semântica, com uma correlação de Pearson de 0,8433, e inferência textual com um F1-score de 0,886.
URI: https://repositorio.ufpe.br/handle/123456789/49952
Appears in Collections:(TCC) - Sistemas da Computação

Files in This Item:
File Description SizeFormat 
TCC Pedro Manoel Farias Sena de Lima.pdf655.43 kBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



Este item está licenciada sob uma Licença Creative Commons Creative Commons