Skip navigation
Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpe.br/handle/123456789/36676

Comparte esta pagina

Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorREN, Tsang Ing-
dc.contributor.authorGUERRERO PEÑA, Fidel Alejandro-
dc.date.accessioned2020-02-28T16:48:16Z-
dc.date.available2020-02-28T16:48:16Z-
dc.date.issued2019-11-27-
dc.identifier.citationGUERRERO PEÑA, Fidel Alejandro. Loss Function Modeling for Deep Neural Networks Applied to Pixel-level Tasks. 2019. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2019.pt_BR
dc.identifier.urihttps://repositorio.ufpe.br/handle/123456789/36676-
dc.description.abstractIn recent years, deep convolutional neural networks has overcome several challenges in the Ąeld of Computer Vision and Image Processing. Particularly, pixel-level tasks such as image segmentation, restoration, generation, enhancement, and inpainting have shown signiĄcant improvements thanks to the advances of the technique. In general, training a neural network is similar to solving a complex optimization problem where the unknowns are the parameters of the model, and the goal is to transform vectors from the input domain to the output set. This optimization process can be seen as a directed search through an error surface where the optimal set of weights is the one that gives a minimal error over a data sample. Since reaching the global minimum is very difficult, the task is simpliĄed to Ąnd an acceptable solution for the task. However, because of the high dimensionality of the solution space, the non-convexity of the error surface, and the presence of many Ćat regions and saddle points in the surface, the process of training a neural network is generally addressed by carefully tuning the hyperparameters of the model and annotating a vast training dataset. The three core components of the cost function used for supervised training are the architecture, the data, and the loss function. Despite the emergence of many new architectures, Ąnding better networks to solve a task is difficult. The modeling of new loss functions is a more feasible approach to improve the optimization and, therefore, Ąnd better-performed models. This work proposes to use a given network, and concentrates on the designing of loss functions for pixel-level regression and pixel-level classiĄcation problems, namely, image segmentation, to improve results. The rationale behind proposed loss functions is that the incorporation of priors in the form of regularization terms helps to distinguish between similarly-performed models, like the ones found in Ćat regions. New pre-processing and post-processing techniques are also introduced in each case to assist in solving real-life problems. The applicability of pixel-level classiĄcation loss functions in instance segmentation task with full and weak supervision was studied using challenging biological image datasets with isolated and clustered cells for both 2D and 3D. A pixel-level regression loss function was applied to the multi-focus image fusion problem. Experimental results for instance segmentation and image restoration tasks suggest an improvement of the performance when compared to other competitive loss functions. 3D segmentation and multi-focus image fusion approaches showed low execution time.pt_BR
dc.description.sponsorshipFACEPEpt_BR
dc.language.isoporpt_BR
dc.publisherUniversidade Federal de Pernambucopt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectInteligência Computacionalpt_BR
dc.subjectRedes Convolucionais Profundaspt_BR
dc.subjectFunção de Perdapt_BR
dc.subjectSegmentação de Instânciaspt_BR
dc.titleLoss Function Modeling for Deep Neural Networks Applied to Pixel-level Taskspt_BR
dc.typedoctoralThesispt_BR
dc.contributor.advisor-coVASCONCELOS, Germano Crispim-
dc.contributor.authorLatteshttp://lattes.cnpq.br/5830491865913075pt_BR
dc.publisher.initialsUFPEpt_BR
dc.publisher.countryBrasilpt_BR
dc.degree.leveldoutoradopt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3084134533707587pt_BR
dc.publisher.programPrograma de Pos Graduacao em Ciencia da Computacaopt_BR
dc.description.abstractxNos últimos anos, os métodos baseados em redes convolucionais profundas superaram vários desafios no campo de Visão Computacional e Processamento de Imagens. Particularmente, tarefas em nível de pixel, como segmentação, restauração, geração, inpainting, e recuperação de informação em imagens, mostraram melhorias significativas graças ao avanço das redes neurais profundas. No geral, o treinamento de uma rede neural é o mesmo que resolver um problema de otimização complexo, onde as incógnitas são os parâmetros do modelo, e o objetivo é transformar vetores do domínio de entrada para o conjunto de saída. Esse processo de otimização pode ser visto como uma busca direcionada em uma superfície de erro, em que o conjunto ideal de pesos é aquele que gera um erro mínimo em uma amostra de dados. Dado que chegar ao mínimo global é muito difícil, a tarefa é simplificada a encontrar uma solução aceitável para uma tarefa dada. No entanto, devido à alta dimensionalidade do espaço da solução, a não-convexidade da superfície de erro, e a presença de muitas planícies, o processo de treinamento de uma rede neural é geralmente tratado por meio do ajuste cuidadoso dos hiperparâmetros do modelo e criando anotações de um amplo conjunto de dados de treinamento. As três componentes principais da função de custo usada no treinamento supervisionado são a arquitetura, os dados, e a função de perda. Apesar do surgimento de muitas novas arquiteturas, encontrar modelos com desempenho aceitável é muito difícil. A modelagem de funções de perda é uma abordagem mais efetiva para melhorar o processo de otimização e, por consequência, achar modelos com melhor desempenho. Este trabalho propõe-se a usar uma rede dada e concentra-se na proposição de funções de perda para problemas de regressão e classificação em nível de pixel, também conhecida como segmentação de imagem, visando a melhorar o desempenho. A lógica por trás das funções de perda propostas é que a incorporação de priors em forma de regularização ajuda a diferenciar modelos com desempenho semelhante. Novas técnicas de pré-processamento e pós-processamento também são propostas em cada caso para ajudar na solução de problemas reais. A aplicabilidade das funções de perda de classificação em nível de pixel na tarefa de segmentação de instância com supervisão completa e fraca foi estudada usando conjuntos de dados desafiadores de imagem biológica com células isoladas e agrupadas para 2D e 3D. A função de perda de regressão em nível de pixel foi aplicada ao problema de fusão de imagem com múltiplos focos. Os resultados da experimentação em tarefas de segmentação de instâncias e restauração de imagens sugerem uma melhoria do desempenho quando comparado com funções de perda semelhantes. Nas propostas de segmentação 3D e fusão de imagens com múltiplos focos, foi observado um baixo tempo de execução.pt_BR
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/5943634209341438pt_BR
Aparece en las colecciones: Teses de Doutorado - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TESE Fidel Alejandro Guerrero Pena.pdf8,34 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está protegido por copyright original



Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons