Roberto Valenzuela: Aplicaciones de las redes neuronales

RECONOCIMIENTO AUTOMÁTICO DE CARACTERES MANUSCRITOS Y MARCAS, ORIENTADO AL PROCESADO DE ENCUESTAS

Las redes neuronales tienen muchos tipos de aplicaciones distintas una de ellas es en reconocimiento automático de caracteres manuscritos y marcas. aplicaciones.

Esta entrada es para puntos extras , se busco en scholar google , una aplicación de ellas.

La sociedad actual produce cantidades crecientes de información distribuidos en imágenes,documentos impresos, gráficas y archivos de audio y vídeo impulsando el desarrollo de sistemas de adquisición de información cada vez más complejos y de mayor alcance en servicios.

El procesamiento digital de imágenes ha adquirido en estos años recientes un papel importante en las tecnologías de la información y el computo , y en estos tiempos es la base de una creciente variedad de aplicaciones que incluyen diagnosis médica, percepción remota, exploración espacial, visión por computadora, reconocimiento de patrones, etc.

Se diseño una aplicacion software para reconocimiento de marcas y caracteres mauscritos basada en un procesamiento digital de imagenes y redes neuronales, aplicable a la toma del contenido de una encuesta.

Este proceso tiene grades vetajas como evitar la digitacion manual necesaria para el archivado de grandes cantidades de documentos.

ETAPAS DEL PROCESO IMPLEMENTADO

En general, se puede considerar que el proceso implementado consta de dos bloques principales:

- Captura de documentos.
- Captura de datos.

Aqui se muestra el diagrama de bloques

En este proceso empiesa con la adquisición de las imágenes.

Mediante un scanner se toma la imagen
El algoritmo de reconocimiento de marcas(óvalos) y caracteres se basa en el tratamiento digital de la imagen
en niveles de grises de 8 bits, ya que éste formato es el más apropiado puesto que no requiere gran capacidad de almacenaje y la información que brinda es suficiente para ejecutar tareas de reconocimiento.

Despues sigue con el reconocimiento de marcas

El algoritmo parte de la toma de los parámetros definidos en una hoja de calibración los cuales se aplican
para las demás hojas de la encuesta. El algoritmo de identificación de marcas (óvalos) consta
básicamente de dos etapas:

La primera, lleva a cabo la segmentación en las zonas de respuestas y la segunda, identifica las marcas con base en un porcentaje de pixeles que se encuentren por debajo de un umbral especifico.

Se desarrollan dos métodos para el reconocimiento de marcas (óvalos).

1. Método manual.
2. Método automático.

1) Método Manual. Se ajustan los parámetros manualmente y el desarrollo de la calibración, depende del usuario.

Los parámetros a ajustar son:

- Factor delta x (dx).
- Factor delta y (dy).
- Umbral.
- Porcentaje de referencia (Pr).

Una vez que se halla el Delta x, Delta y para los diferentes grupos en la hoja de calibración, las coordenadas de los centroides de cada celda permanecen fijas, y el tamaño de éstas, dependerán de los valores que
tome el factor dx y dy.

2) Método automático. Es un algoritmo que garantiza y busca el mejor ajuste de los parámetros para la
identificación de marcas u óvalos. Este método se basa en el estudio de los pixeles encendidos en las celdas activas y celdas no activas.

El método automático realiza una búsqueda secuencial de los parámetros (Umbral, Pr, Factor dx, Factor dy), de manera que la diferencia entre el mínimo porcentaje de pixeles encendidos en las celdas activas y el máximo en las inactivas sea máxima y superior al 8%.

Y despues el Reconocimiento de Caracteres

Las etapas implementadas para llevar a cabo el reconocimiento de los caracteres.

1) Preprocesado de la imagen.
Esta etapa requiere las siguientes fases:

Binarización de la imagen.
Depuración de la imagen binarizada.
Ensanchamiento de la imagen depurada.
Extracción del objeto de interés en la imagen ensanchada.
Extracción del contorno del objeto de interés.

2) Representación y descripción.

Los descriptores con mejor comportamiento se describen a continuación.
Firma del Contorno. Es un vector muestreado de la distancia normalizada desde el centroide a cada uno de
los puntos del contorno del carácter .

Eeste procedimiento secciona la imagen en nueve zonas y toma dos descriptores por zona; el primero es la

densidad relativa de píxeles (d1= píxeles del caracter en la zona / píxeles totales), mientras el segundo indica la orientación y ubicación relativa del grupo de píxeles del caracter en la zona. La figura ilustra la implementación de éste método, donde los primeros 9 descriptores corresponden a las densidades y los demás corresponden a las orientaciones por zona.

Para la representación de la imagen de los caracteres se tomó un vector de 42 elementos

conformado por:

-16 Muestras de la firma.

-18 Descriptores de las zonas de la imagen.

- 8 Coeficientes extraídos de los descriptores de fourier .

3) Clasificación de descriptores

Como se mencionó anteriormente, esta etapa se implementó con REDES NEURONALES .

Selección de las Redes Finales

Todas las redes tienen 42 neuronas en la capa de entrada, se entrenaron con 19 tipos de caracteres y luego se validaron con otros 11 tipos. La tabla muestra la arquitectura de las redes seleccionadas

Generación del Archivo de Resultados

Los resultados del procesado de las encuestas se almacenan en un archivo de texto plano. En el caso del
reconocimiento de marcas, la primera columna indica el número de la hoja (NE), la segunda el número de la
pregunta (NP) mientras que de la tercera columna en adelante (letras A, B, C, ..) se indica con uno, la respuesta seleccionada. Para el reconocimiento de caracteres cada fila del archivo corresponde a un campo de la hoja de encuesta .

Referencias pdf sacado scholar.google.com.mx

http://www.compelect.com.co/archivos/diamatlab/2005/Ponencia16.pdf

Roberto Valenzuela

martes, 13 de noviembre de 2012

Aplicaciones de las redes neuronales

1 comentario:

Datos personales

Archivo del blog