Roberto Valenzuela: enero 2013

Robust Real-Time Face Detection

Este es un marco de detección de rostros de gran rapidez.

Este sistema opera con imágenes de 384 x 288 pixeles, y los rostros son detectados a 15 fotogramas por segundo. Tiene 3 principales aportaciones la primera contribución es una representación de la imagen nueva se llama imagen integral que permite evaluar características muy rápido. El sistema de detección no trabaja directamente con la intensidad de la imagen.

La segunda contribución es un simple clasificador eficiente que se construye mediante la selección de una pequeña serie de características importantes de una biblioteca enorme de características potenciales utilizando AdaBoost.A fin de garantizar rápido clasificación, el proceso de aprendizaje debe excluir a la gran mayoría de las funciones disponibles, y se centran en un pequeño conjunto de características fundamentales la función de selección se realiza mediante el algoritmo de aprendizaje AdaBoost al restringir cada clasificador débil que depender de sólo una única función. Como resultado cada etapa del proceso de impulsar, que selecciona un clasificador débil nuevo, se puede ver como un proceso de selección de características. AdaBoost ofrece un aprendizaje efectivo

algoritmo y límites fuertes sobre el rendimiento de generalización.

La tercera contribución importante de este trabajo es un método para combinar clasificadores sucesivamente más complejos en una estructura en cascada que aumenta drásticamente la velocidad del detector centrando la atención en regiones prometedoras de la imagen. El concepto es enfocar donde es posible que una cara pueda existir. El procesamiento más complejo está reservado sólo para estas prometedoras regiones. La medida clave de este enfoque es la "Falso negativo" velocidad del proceso atencional. Se debe darse el caso de que todas las instancias de la cara, o casi todos, están seleccionada por el filtro de atención.

Características de como trabaja.

Este procedimiento de detección de rostros clasifica imágenes basándose en el valor de las funciones simples.Existen muchas motivaciones para el uso de funciones en lugar de los píxeles directamente. La razón más común es que las características pueden actuar para codificar adecuadamente el conocimiento del dominio que es difícil de aprender utilizando una cantidad finita de datos de entrenamiento. Para este sistema también hay segunda motivación crítica para las características: el sistema basado en características funciona mucho más rápido que un sistema basado en píxeles. Las características simples que se usan son una reminiscencia de funciones Haar de base que han sido utilizados por Papageorgiou. En concreto, se utilizan tres tipos de características. El valor de una función de dos rectángulo es el diferencia entre la suma de los píxeles dentro de los dos regiones rectangulares. Las regiones tienen el mismo tamaño y forma, y están horizontalmente o verticalmente adyacentes . A three-rectangle feature calcula la suma de dos rectángulos externos restando la suma de un rectángulo central. Finalmente el cuarto rectángulo calcula la diferencia entre los pares diagonales de rectángulos.

La suma de los píxeles que se encuentran dentro de los rectángulos blancos se restan de la suma de los píxeles en los rectángulos grises.Two-rectangle features se muestran en (A) y (B). Figura

Las características del rectángulo se puede calcular muy rápidamente, usando una representación intermedia de la imagen que llamamos la imagen integral. La imagen integral en la posición x, y, contiene la suma de los píxeles por encima y a la izquierda de x, y, inclusive:

donde ii (x, y) es la imagen integral y i (x, y) es la imagen original. Usando el siguiente par de

recurrencias:

(donde s (x, y) es la suma acumulativa fila, s (x, -1) = 0, y ii (-1, y) = 0) la imagen integral puede ser calculada en una sola pasada sobre la imagen original. Utilizando la imagen integral puede ser cualquier cantidad rectangular calcula en matriz de cuatro (fig. 3). Claramente la diferencia entre dos sumas rectangulares pueden ser calculadas en ocho referencias. Dado que las características de dos rectángulo definido anteriormente implican adyacente rectangular sumas que se pueden calcular en matriz de seis, ocho en el caso de las características de tres rectángulos, y nueve para las características de cuatro rectángulos. Una de las motivaciones alternativo para la imagen integral viene de la "boxlets".

Roberto Valenzuela

miércoles, 30 de enero de 2013

LAB DE COMPUTO UBICUO

martes, 22 de enero de 2013

Telecomunicaciones

Aplicaciones de Visión Computacional

Vision computacional

Datos personales

Archivo del blog