Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/49952

Share on

Full metadata record
DC FieldValueLanguage
dc.contributor.advisorTEDESCO, Patrícia Cabral de Azevedo Restelli-
dc.contributor.authorLIMA, Pedro Manoel Farias Sena de-
dc.date.accessioned2023-05-08T13:20:41Z-
dc.date.available2023-05-08T13:20:41Z-
dc.date.issued2023-05-04-
dc.date.submitted2023-05-04-
dc.identifier.citationLIMA, Pedro Manoel Farias Sena de. Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa. 2023. 25 f. TCC (Graduação) - Curso de Sistemas de Informação, Centro de Informática, Universidade Federal de Pernambuco, Recife, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/49952-
dc.description.abstractOs avanços na área de processamento de linguagem natural permitiram o surgimento de modelos de linguagem mais eficientes e capazes de atingir o estado da arte dentro dessa área. Porém, esses avanços representam quase que exclusivamente modelos que utilizam o inglês como sua língua principal. Em relação a outras línguas, como o português, esses avanços não seguem o mesmo ritmo. O seguinte trabalho busca realizar uma análise comparativa de métodos de modelos de linguagem capazes de utilizar a língua portuguesa, e para isso foram utilizados dois modelos, o BERT (do inglês, Bidirectional Encoder Representation from Transformers) e o BERTimbau, modelo baseado no BERT treinado para o português. A avaliação dos modelos foi feita utilizando a base de dados ASSIN 2. Os resultados mostraram que o BERTimbau atingiu uma melhor performance nas tarefas de similaridade semântica, com uma correlação de Pearson de 0,8433, e inferência textual com um F1-score de 0,886.pt_BR
dc.format.extent25 f.pt_BR
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectModelos de linguagempt_BR
dc.subjectBERTpt_BR
dc.subjectSimilaridade semânticapt_BR
dc.subjectInferência textualpt_BR
dc.titleUma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesapt_BR
dc.typebachelorThesispt_BR
dc.contributor.advisor-coANDRADE, Havana Diogo Alves-
dc.degree.levelGraduacaopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7465148175791735pt_BR
dc.description.abstractxAdvances in the area of natural language processing allowed the development of more efficient language models capable of reaching the state of the art within this area. However, these advances represent almost exclusively in models that use English as their main language. When you turn to other languages, such as Portuguese, these advances do not follow the same pace. The following work seeks to analyze methods of language models capable of using the Portuguese language, for which two models were used, BERT (Bidirectional Encoder Representation from Transformers) and BERTimbau, a model based on BERT trained for Portuguese. The evaluation of the models was done using the ASSIN 2 database. The results found that BERTimbau provided a better performance in the tasks of semantic textual similarity, with a Pearson link of 0.8433, and recognising textual entailment with an F1-score of 0.886pt_BR
dc.subject.cnpqÁreas::Ciências Exatas e da Terra::Ciência da Computaçãopt_BR
dc.degree.departament::(CIN-DIS) - Departamento de Informação e Sistemaspt_BR
dc.degree.graduation::CIn-Curso de Sistemas de Informaçãopt_BR
dc.degree.grantorUniversidade Federal de Pernambucopt_BR
dc.degree.localRecifept_BR
Appears in Collections:(TCC) - Sistemas da Computação

Files in This Item:
File Description SizeFormat 
TCC Pedro Manoel Farias Sena de Lima.pdf655.43 kBAdobe PDFThumbnail
View/Open


This item is protected by original copyright



This item is licensed under a Creative Commons License Creative Commons