Investigação do uso de computação evolucionária para descoberta de subgrupos em conjuntos de dados numéricos de alta dimensionalidade

LUCENA, Avyner Henrique Bezerra da Fonseca

Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/36682

Compartilhe esta página

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	VIMIEIRO, Renato	-
dc.contributor.author	LUCENA, Avyner Henrique Bezerra da Fonseca	-
dc.date.accessioned	2020-02-28T17:37:04Z	-
dc.date.available	2020-02-28T17:37:04Z	-
dc.date.issued	2019-08-09	-
dc.identifier.citation	LUCENA, Avyner Henrique Bezerra da Fonseca. Investigação do uso de computação evolucionária para descoberta de subgrupos em conjuntos de dados numéricos de alta dimensionalidade. 2019. Dissertação (Mestrado em Ciências da Computação) – Universidade Federal de Pernambuco, Recife, 2019.	pt_BR
dc.identifier.uri	https://repositorio.ufpe.br/handle/123456789/36682	-
dc.description.abstract	O trabalho proposto nesta dissertação, se trata de um novo algoritmo evolucionário para a área de Subgroup Discovery “SD”, com foco na mineração de padrões em conjuntos de dados numéricos de alta dimensionalidade. Subgroup Discovery é uma técnica descritiva para mineração de dados, cujo objetivo é encontrar e descrever subgrupos em conjuntos de dados, a partir de propriedades de interesse previamente definidas. A área em questão possui uma ampla gama de aplicações e casos de uso, porém poucas dessas técnicas são capazes de atuar adequadamente sobre atributos numéricos contínuos. O que pode ser considerado um problema, tendo em vista que conjuntos de dados provenientes do mundo real recorrentemente possuem atributos de diferentes tipos. Para poder trabalhar com dados contínuos, algumas técnicas de SD demandam discretização prévia de tais atributos. Porém, esse tipo de solução tende a trazer perda de informações e resultados imprecisos. Devido ao rápido desenvolvimento das tecnologias de coleta e armazenamento de dados, problemas cada vez mais complexos tendem a surgir. Um bom exemplo, são os conjuntos de dados de alta dimensionalidade, que, por sua vez, podem possuir centenas de milhares de atributos, tornando ainda mais desafiadora a tarefa de mineração de padrões e consequentemente, a descoberta de subgrupos. Até o momento, não existem trabalhos publicados na área com foco em conjuntos numéricos de alta dimensionalidade. Então, o rabalho aqui proposto visa otimizar o processo de descoberta de subgrupos por meio de dois aspectos principais, que são: i) trabalhar adequadamente com dados contínuos sem eixar de abranger categóricos, e ii) propor uma estratégia evolucionária capaz de lidar com conjuntos de dados de alta dimensionalidade. Após a realização de um amplo estudo experimental, o algoritmo proposto se demonstrou competitivo e, muitas vezes, superior em relação a outras técnicas do estado da arte e trabalhos recém-publicados na área.	pt_BR
dc.description.sponsorship	FACEPE	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Universidade Federal de Pernambuco	pt_BR
dc.rights	embargoedAccess	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Inteligência computacional	pt_BR
dc.subject	Subgroup discovery	pt_BR
dc.subject	Conjunto de dados numéricos	pt_BR
dc.subject	Alta dimensionalidade	pt_BR
dc.title	Investigação do uso de computação evolucionária para descoberta de subgrupos em conjuntos de dados numéricos de alta dimensionalidade	pt_BR
dc.type	masterThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/4392909251260088	pt_BR
dc.publisher.initials	UFPE	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.degree.level	mestrado	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/5736183954752317	pt_BR
dc.publisher.program	Programa de Pos Graduacao em Ciencia da Computacao	pt_BR
dc.description.abstractx	The work proposed in this dissertation, is a new evolutionary algorithm for the Subgroup Discovery “SD” area, and its main focus is the mineration of patterns in high dimensionality numerical datasets. Subgroup Discovery is a descriptive technique for data mining, which aims to find and describe subgroups in data, accordingly to predefined interest properties. The SD area have a wide range of applications and use cases, but few are able to perform properly over continuous numerical attributes, what can be seen as a problem, given that real word related datasets, usually have mixed data types. To work with continuous data, some SD techniques require a previous discretization, but this kind of solution may lead to information loss and imprecise results. The fast development of data collecting and storage technologies is leading to the emergence of new complex problems, such as high dimensional data, which can easily have hundreds of thousands attributes, making the pattern mining task and consequently subgroup discovery, even harder in those scenarios. To the moment this work is being presented, there are no published techniques in the area, that address the problem of high dimensional numerical datasets; so the proposed algorithm aims to optimize the subgroup discovery process by means of: Properly representation of numerical data without neglecting categorical data; together with an evolutionary strategy able to deal with high dimensionality data. After an extensive experimental study, the proposed algorithm showed itself competitive and many times superior when compared with other state of the art techniques and recently published works.	pt_BR
Aparece nas coleções:	Dissertações de Mestrado - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
DISSERTAÇÃO Avyner Henrique Bezerra da Fonseca Lucena.pdf		774,43 kB	Adobe PDF	Visualizar/Abrir

Este arquivo é protegido por direitos autorais

Ver licença

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons