Uso de aprendizado supervisionado multivisão para atribuição automática de autoria de textos

SOUSA, Luís Fred Gonçalves de

Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/38965

Compartilhe esta página

Título:	Uso de aprendizado supervisionado multivisão para atribuição automática de autoria de textos
Autor(es):	SOUSA, Luís Fred Gonçalves de
Palavras-chave:	Inteligência computacional; Aprendizagem de máquina
Data do documento:	20-Ago-2020
Editor:	Universidade Federal de Pernambuco
Citação:	SOUSA, Luís Fred Gonçalves de. Uso de aprendizado supervisionado multivisão para atribuição automática de autoria de textos. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2020.
Abstract:	Atribuição de autoria é o problema de identificar o autor de um ou mais textos com base no estilo de escrita do autor. Normalmente, a tarefa assume que o estilo de escrita dos autores conserva traços que são inacessíveis à manipulação consciente. Dessarte, tal poderia ser seguramente usado para identificar o autor de um texto. Os pesquisadores têm investigado um grande número de características textuais com o objetivo de validar a habilidade destas de revelar mecanismos subconscientes de variação de linguagem, os quais podem, consequentemente, refletir autoria. Muitos marcadores de estilo autorial já foram propostos na literatura. Não obstante, permanece a falta de consenso sobre qual é o melhor para representar as escolhas dos autores. Esta dissertação assume um ponto de vista neutro na disputa pelo melhor conjunto de características de texto capaz de representar estilos de escrita. No lugar disso, é investigado como diferentes fontes de informação podem relevar diferentes aspectos do estilo de um autor, complementando-se, assim, para aprimorar o processo geral de atribuição de autoria. Com esse propósito, o problema de atribuição de autoria é modelado nesse estudo como uma tarefa de aprendizado de máquina multivisão. A eficácia da abordagem proposta é avaliada em quatro conjuntos de dados com número variado de autores e obras. A performance do método é comparada ao estado da arte em abordagens de aprendizado de máquina para atribuição de autoria. No decorrer do estudo, foi analisado como o método multivisão aprimora as abordagens tradicionais que usam uma única fonte de informação para atribuir autoria, os quais foram chamados de métodos univisão. Os resultados confirmam a relevância de algumas características individuais de texto para a tarefa, mas também mostram como essas características se complementam com outros tipos de recursos linguísticos para melhorar a consistência e a precisão da atribuição de autoria. Ademais, foi verificado que os classificadores treinados com dados multivisão consistentemente concordam sobre os rótulos verdadeiros dos textos. O estudo ainda discute como essas melhorias, tanto na acurácia quanto na concordância de classificação, são benéficas para linguistas e outros especialistas.
URI:	https://repositorio.ufpe.br/handle/123456789/38965
Aparece nas coleções:	Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
DISSERTAÇÃO Luís Fred Gonçalves de Sousa.pdf		2.36 MB	Adobe PDF	Visualizar/Abrir

Este arquivo é protegido por direitos autorais

Ver licença

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons