Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/1414
Title: Uma abordagem não supervisionada para classificação de opinião usando o recurso léxico SentiWordNet
Authors: CAVALCANTI, Diana Cabral
Keywords: Análise de Sentimento; Mineração de Opinião; Classificação de Sentimento; Recurso Léxico; SentiWordNet
Issue Date: 31-Jan-2011
Publisher: Universidade Federal de Pernambuco
Citation: Cabral Cavalcanti, Diana; Bastos Cavalcante Prudêncio, Ricardo. Uma abordagem não supervisionada para classificação de opinião usando o recurso léxico SentiWordNet. 2011. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2011.
Abstract: Mineração de Opinião, também chamada de Análise de Sentimento, explora o estudo computacional de opiniões, sentimentos e emoções expressadas em fontes como textos não estruturados. Com a crescente popularidade e disponibilidade de recursos para se veicular opiniões na Web, os internautas passaram a ser não só um mero consumidor de um produto já pronto, mas também um gerador de conteúdo na Web. A classificação de sentimento tem o desafio de automatizar a análise de opiniões na Web, a fim de colaborar na forma como as pessoas podem, fazem e usam ativamente as tecnologias de informação para buscar e compreender as opiniões dos outros. Diversas pesquisas têm explorado métodos supervisionados e não supervisionados para classificação de sentimento que abrangem técnicas de processamento de linguagem natural, recuperação da informação e recursos léxicos. Este trabalho propõe o uso do recurso Léxico SentiWordNet, com um método não supervisionado, que realiza a seleção de termos unigrama nas classes gramaticais adjetivo, advérbio, substantivo e verbo, para classificar a polaridade, se negativa, positiva ou neutra, de termos e documentos. A fim de avaliar o desempenho do método, experimentos foram realizados em duas bases de dados, que abrangem comentários extraídos do Amazon.com e citações em artigos científicos. Os resultados obtidos experimentalmente mostraram que o SentiWordNet atingiu uma média de 76% para o total de termos distintos extraídos, a maior taxa de acerto global foi 58% para a base de documentos do Amazon.com e 18.83% para a base de artigos científicos
URI: https://repositorio.ufpe.br/handle/123456789/1414
Appears in Collections:Dissertações de Mestrado - Ciência da Computação

Files in This Item:
File Description SizeFormat 
arquivo1261_1.pdf2.36 MBAdobe PDFView/Open


This item is protected by original copyright



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.