Clasificación de objetos en movimiento en video comprimido

Transcripción

Clasificación de objetos en movimiento en video comprimido
Clasificación de objetos en movimiento en video comprimido
1. Responsables
John Goddard Close, Luis Martín Rojas Cárdenas
2. Perfil deseable del alumno.
a. Conocimientos en Probabilidad y Estadística.
b. Nociones de compresión de video.
c. Buen nivel de programación en Lenguaje C/C++ o MATLAB.
3. Presentación del contexto e identificación de la problemática
El conteo de objetos es una actividad orientada a la obtención de datos estadísticos y útil para
llevar, entre otros, un control del número de productos fabricados en una cadena de producción, del
número de vehículos circulando por una avenida a determinada hora del día o de la cantidad de
personas que hacen uso de un sistema de transporte en particular. En el pasado esta actividad se
desarrollaba en forma manual, pero ahora, con la gran cobertura de sistemas de video vigilancia, la
tendencia es automatizar esta actividad con la ayuda de sistemas de cómputo dotados con algoritmos
para el reconocimiento de patrones. El funcionamiento de los cuales se basa en el uso de técnicas de
segmentación, de estimación de movimiento, de extracción del fondo de la escena, etc. Es importante
mencionar que la gran mayoría de estas técnicas operan sobre conjuntos de píxeles, es decir en flujos
de video no comprimidos o video en bruto (e inglés: raw video). Aquí surge un detalle a considerar, las
cámaras de video vigilancia convencionales no generan video en bruto sino video comprimido, el cual
presenta, entre otros, distorsiones y pérdida de información. Así, aplicar estos algoritmos al video
comprimido requiere, primeramente, descomprimir totalmente el video, después, evaluar si las
imperfecciones del video comprimido no afectan el desempeño de los algoritmos propuestos.
En esta tesis de maestría se propone utilizar informaciones directamente disponibles en el video
comprimido, que no son píxeles, sino informaciones particulares (coeficientes frecuenciales y vectores
de movimiento), para realizar la clasificación de objetos que aparecen en la escena de video, tales como
personas, vehículos, animales, etc. El uso de estas informaciones debe beneficiar considerablemente el
ahorro de recursos de cómputo y hacer más directo el proceso de reconocimiento en video comprimido.
Además, el trabajo que aquí se propone toma como referencia un trabajo previo [3].
4. Objetivos generales y específicos del proyecto de investigación
Objetivo general:
Encontrar un algoritmo que permita distinguir y clasificar los diferentes objetos que aparecen en una
escena de video comprimido.
Objetivos particulares
- Comprender diferentes tecnologías para efectuar la codificación de video.
- Conocer diferentes técnicas para el análisis de imágenes.
- Obtener un algoritmo para clasificar objetos basado en la información frecuencial y temporal, ambas
presentes en el flujo de video comprimido. El algoritmo debe ser de bajo costo computacional.
5. Metodología propuesta
a) Análisis del estado del conocimiento en propuestas similares poniendo una particular atención a las
herramientas matemáticas de base.
b) Estudio de las técnicas de codificación de video.
c) Prueba de diferentes técnicas para el análisis de imágenes, tanto en el terreno frecuencial, como en
el temporal.
d) Selección de una norma de compresión de video sobre la cual se desarrollará el algoritmo.
e) Propuesta de un algoritmo para la clasificación de objetos.
f) Pruebas de desempeño.
g) Elaboración de un artículo de investigación.
h) Redacción de la Idónea Comunicación de Resultados.
6. Resultados esperados
a) Un algoritmo para la clasificación de objetos partir de informaciones frecuenciales y de movimiento.
c) Un artículo de investigación.
7. Referencias a la literatura inicial
[1] Antonini, G., Thiran, J.P., “Counting Pedestrians in Video Sequences Using Trajectory Clustering”,
CirSysVideo(16), No. 8, August 2006, pp. 1008-1020.
[2] Teixeira, T., Savvides, A., “Lightweight People Counting and Localizing in Indoor Spaces Using
Camera Sensor Nodes”, ICDSC07.
[3] Gustavo Flores Chapa, “conteo de personas en video H.264”, tesis de maestría, Universidad
Autónoma Metropolitana, 2011.
8. Calendarización de actividades
Trimestre
Actividad
1er
1
2
Análisis de estado del conocimiento
Estudio de técnicas para la codificación de video
Propuesta inicial de un algoritmo de clasificación.
Presentación oral del protocolo de investigación.
Prueba de técnicas selecionadas.
Presentación oral del protocolo de investigación.
Integración de un sistema de clasificación.
Elaboración de articulo de investigación
Redacción de la Idónea Comunicación de Resultados
9. Infraestructura necesaria y disponible
1. Cámara de alta resolución (1440x1080 píxeles).
2. Secuencias de video conteniendo objetos en movimiento.
10. Lugar de realización
Edificio T, Sala 329 bis.
2do
3
1
2
3er
3
1
2
3

Documentos relacionados