Skip navigation
Please use this identifier to cite or link to this item: https://repositorio.ufpe.br/handle/123456789/5603
Title: Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
Authors: Ferreira Alves, Neide
Keywords: OCR; Reconhecimento de Padrões; Processamento de Imagens
Issue Date: 31-Jan-2008
Publisher: Universidade Federal de Pernambuco
Citation: Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.
Abstract: Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragem
URI: https://repositorio.ufpe.br/handle/123456789/5603
Appears in Collections:Dissertações de Mestrado - Engenharia Elétrica

Files in This Item:
File Description SizeFormat 
arquivo7036_1.pdf2 MBAdobe PDFView/Open


This item is protected by original copyright



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.