Use este identificador para citar ou linkar para este item:
https://repositorio.ufpe.br/handle/123456789/49952
Compartilhe esta página
| Título: | Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa |
| Autor(es): | LIMA, Pedro Manoel Farias Sena de |
| Palavras-chave: | Processamento de linguagem natural; Modelos de linguagem; BERT; Similaridade semântica; Inferência textual |
| Data do documento: | 4-Mai-2023 |
| Citação: | LIMA, Pedro Manoel Farias Sena de. Uma análise comparativa de métodos de avaliação de modelos de linguagem na língua portuguesa. 2023. 25 f. TCC (Graduação) - Curso de Sistemas de Informação, Centro de Informática, Universidade Federal de Pernambuco, Recife, 2023. |
| Abstract: | Os avanços na área de processamento de linguagem natural permitiram o surgimento de modelos de linguagem mais eficientes e capazes de atingir o estado da arte dentro dessa área. Porém, esses avanços representam quase que exclusivamente modelos que utilizam o inglês como sua língua principal. Em relação a outras línguas, como o português, esses avanços não seguem o mesmo ritmo. O seguinte trabalho busca realizar uma análise comparativa de métodos de modelos de linguagem capazes de utilizar a língua portuguesa, e para isso foram utilizados dois modelos, o BERT (do inglês, Bidirectional Encoder Representation from Transformers) e o BERTimbau, modelo baseado no BERT treinado para o português. A avaliação dos modelos foi feita utilizando a base de dados ASSIN 2. Os resultados mostraram que o BERTimbau atingiu uma melhor performance nas tarefas de similaridade semântica, com uma correlação de Pearson de 0,8433, e inferência textual com um F1-score de 0,886. |
| URI: | https://repositorio.ufpe.br/handle/123456789/49952 |
| Aparece nas coleções: | (TCC) - Sistemas da Computação |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| TCC Pedro Manoel Farias Sena de Lima.pdf | 655.43 kB | Adobe PDF | ![]() Visualizar/Abrir |
This item is protected by original copyright |
This item is licensed under a Creative Commons License

