Please use this identifier to cite or link to this item:
https://repositorio.ufpe.br/handle/123456789/49952
Share on
Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | TEDESCO, Patrícia Cabral de Azevedo Restelli | - |
| dc.contributor.author | LIMA, Pedro Manoel Farias Sena de | - |
| dc.date.accessioned | 2023-05-08T13:20:41Z | - |
| dc.date.available | 2023-05-08T13:20:41Z | - |
| dc.date.issued | 2023-05-04 | - |
| dc.date.submitted | 2023-05-04 | - |
| dc.identifier.citation | LIMA, Pedro Manoel Farias Sena de. Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa. 2023. 25 f. TCC (Graduação) - Curso de Sistemas de Informação, Centro de Informática, Universidade Federal de Pernambuco, Recife, 2023. | pt_BR |
| dc.identifier.uri | https://repositorio.ufpe.br/handle/123456789/49952 | - |
| dc.description.abstract | Os avanços na área de processamento de linguagem natural permitiram o surgimento de modelos de linguagem mais eficientes e capazes de atingir o estado da arte dentro dessa área. Porém, esses avanços representam quase que exclusivamente modelos que utilizam o inglês como sua língua principal. Em relação a outras línguas, como o português, esses avanços não seguem o mesmo ritmo. O seguinte trabalho busca realizar uma análise comparativa de métodos de modelos de linguagem capazes de utilizar a língua portuguesa, e para isso foram utilizados dois modelos, o BERT (do inglês, Bidirectional Encoder Representation from Transformers) e o BERTimbau, modelo baseado no BERT treinado para o português. A avaliação dos modelos foi feita utilizando a base de dados ASSIN 2. Os resultados mostraram que o BERTimbau atingiu uma melhor performance nas tarefas de similaridade semântica, com uma correlação de Pearson de 0,8433, e inferência textual com um F1-score de 0,886. | pt_BR |
| dc.format.extent | 25 f. | pt_BR |
| dc.language.iso | por | pt_BR |
| dc.rights | openAccess | pt_BR |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
| dc.subject | Processamento de linguagem natural | pt_BR |
| dc.subject | Modelos de linguagem | pt_BR |
| dc.subject | BERT | pt_BR |
| dc.subject | Similaridade semântica | pt_BR |
| dc.subject | Inferência textual | pt_BR |
| dc.title | Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa | pt_BR |
| dc.type | bachelorThesis | pt_BR |
| dc.contributor.advisor-co | ANDRADE, Havana Diogo Alves | - |
| dc.degree.level | Graduacao | pt_BR |
| dc.contributor.advisorLattes | http://lattes.cnpq.br/7465148175791735 | pt_BR |
| dc.description.abstractx | Advances in the area of natural language processing allowed the development of more efficient language models capable of reaching the state of the art within this area. However, these advances represent almost exclusively in models that use English as their main language. When you turn to other languages, such as Portuguese, these advances do not follow the same pace. The following work seeks to analyze methods of language models capable of using the Portuguese language, for which two models were used, BERT (Bidirectional Encoder Representation from Transformers) and BERTimbau, a model based on BERT trained for Portuguese. The evaluation of the models was done using the ASSIN 2 database. The results found that BERTimbau provided a better performance in the tasks of semantic textual similarity, with a Pearson link of 0.8433, and recognising textual entailment with an F1-score of 0.886 | pt_BR |
| dc.subject.cnpq | Áreas::Ciências Exatas e da Terra::Ciência da Computação | pt_BR |
| dc.degree.departament | ::(CIN-DIS) - Departamento de Informação e Sistemas | pt_BR |
| dc.degree.graduation | ::CIn-Curso de Sistemas de Informação | pt_BR |
| dc.degree.grantor | Universidade Federal de Pernambuco | pt_BR |
| dc.degree.local | Recife | pt_BR |
| Appears in Collections: | (TCC) - Sistemas da Computação | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| TCC Pedro Manoel Farias Sena de Lima.pdf | 655.43 kB | Adobe PDF | ![]() View/Open |
This item is protected by original copyright |
This item is licensed under a Creative Commons License

