Skip navigation
Use este identificador para citar ou linkar para este item: https://repositorio.ufpe.br/handle/123456789/36908

Compartilhe esta página

Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorSILVA FILHO, Abel Guilhermino da-
dc.contributor.authorSANTOS, Michel Mozinho dos-
dc.date.accessioned2020-03-09T20:53:34Z-
dc.date.available2020-03-09T20:53:34Z-
dc.date.issued2019-08-28-
dc.identifier.citationSILVA FILHO, Abel Guilhermino da. Classificação de padrões de imagens: função objetivo para perceptron multicamada e máquina de aprendizado extremo convolucional. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/36908-
dc.descriptionSILVA FILHO, Abel Guilhermino da, também é conhecido em citações bibliográficas por: SILVA-FILHO, Abel Guilhermino dapt_BR
dc.description.abstractAvanços recentes em redes neurais profundas possibilitaram resolver certas tarefas de classificação de padrões de imagens com acurácia equivalente ou superior à humana. No entanto, as redes neurais profundas padecem do longo tempo de treinamento (de horas, à dias). Isto pode ser problemático em determinadas aplicações, por exemplo, se o treinamento ocorrer em uma nuvem computacional com cobrança pelo tempo de uso. Nesta tese, abordamos o problema de classificação de padrões de imagens com redes neurais artificiais em duas tarefas diferentes. Na primeira abordagem, propomos funções objetivo específicas para a tarefa de segmentação de lesões de esclerose múltipla (EM), usando uma simples rede perceptron multicamada. Mantendo o tempo do treinamento rápido, uma função objetivo específica resultou em desempenho de segmentação de EM que foi melhor do que com uma função objetivo inespecífica. No entanto, mesmo com função objetivo específica, nosso método de segmentação de EM teve desempenho de segmentação insatisfatório em relação ao estado-da-arte, devido a simplicidade do perceptron multicamada empregado. Em uma segunda abordagem, investigamos máquinas de aprendizado extremo convolucional (convolutional extreme leaning machines, CELM), uma alternativa para desenvolver uma rede neural convolucional de treinamento rápido e com elevada acurácia, na tarefa de reconhecimento de dígitos. Propomos uma CELM profunda com dois estágios de extração de características e duas camadas no estágio de classificação. Comparamos bancos de filtros puros e combinados, em dois estágios de extração de características. Para a CELM proposta, mostramos que o modelo de erro baseado no teorema de Rahimi-Retch é capaz de ajustar o erro empírico. Contribuímos assim para um melhor entendimento do erro de generalização em função do tamanho do conjunto de treinamento e do número de parâmetros ajustáveis, conjecturados previamente como fatores de sucesso do aprendizado profundo. Além disso, no reconhecimento de dígitos, a CELM proposta resultou em acurácia superior (99,775%), bem como em tempo de treinamento competitivo (9 min., em CPU), mesmo em relação a abordagens que empregam processamento em GPU, no conjunto de dados de reconhecimento de dígitos EMNIST.pt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência computacionalpt_BR
dc.subjectFunção objetiva específicapt_BR
dc.subjectMáquina de aprendizado extremo convolucionalpt_BR
dc.subjectegmentação de lesão de esclerose múltiplapt_BR
dc.titleClassificação de padrões de imagens : função objetivo para perceptron multicamada e máquina de aprendizado extremo convolucionalpt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coSANTOS, Wellington Pinheiro dos-
dc.contributor.authorLatteshttp://lattes.cnpq.br/7847040459557504pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8983932189780223pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxRecent advances in deep neural networks have made possible solving image pattern classification tasks with accuracy equivalent to or higher than humans. However, deep neural networks suffer from long training time (from hours to days). The time spent can be problematic in applications, for instance, if the training takes place in a computational cloud with time-to-use charging. In this thesis, we address the problem of image pattern classification with artificial neural networks in two different tasks. In the first approach, we propose specific objective functions for the segmentation of multiple sclerosis (MS) lesions using a simple multilayer perceptron. Keeping the fast training time, a specific objective function resulted in segmentation performance that was better than with a nonspecific objective function. However, even with a specific objective function, our MS segmentation method resulted in unsatisfactory segmentation performance in relation to state-of-theart, due to the simplicity of the multilayer perceptron employed. In the second approach, we have investigated convolutional extreme learning machines (CELMs) for digit recognition task, as an alternative for developing a CNN with fast training time. We propose a deep CELM with two stages of feature extraction and two layers in the classification stage. We compare pure and combined filter banks in two stages of feature extraction. For the proposed CELM, we show that the error model based on the Rahimi-Retch theorem can adjust the empirical error. In this way, we contribute to a better understanding of the generalization error as a function of the training set size and the number of adjustable parameters, which are two conjectured factors for the exceptional generalization capability in deep learning. Moreover, the proposed CELM for digit recognition resulted in superior accuracy (99.775 %) as well as competitive training time (9 min, in CPU), even concerning approaches using GPU processing, over the EMNIST dataset for digit recognition.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/6413917211782026pt_BR
Aparece nas coleções:Teses de Doutorado - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE Michel Mozinho dos Santos.pdf13,08 MBAdobe PDFThumbnail
Visualizar/Abrir


Este arquivo é protegido por direitos autorais



Este item está licenciada sob uma Licença Creative Commons Creative Commons