Clasificación de objetos en movimiento en video comprimido
Transcripción
Clasificación de objetos en movimiento en video comprimido
Clasificación de objetos en movimiento en video comprimido 1. Responsables John Goddard Close, Luis Martín Rojas Cárdenas 2. Perfil deseable del alumno. a. Conocimientos en Probabilidad y Estadística. b. Nociones de compresión de video. c. Buen nivel de programación en Lenguaje C/C++ o MATLAB. 3. Presentación del contexto e identificación de la problemática El conteo de objetos es una actividad orientada a la obtención de datos estadísticos y útil para llevar, entre otros, un control del número de productos fabricados en una cadena de producción, del número de vehículos circulando por una avenida a determinada hora del día o de la cantidad de personas que hacen uso de un sistema de transporte en particular. En el pasado esta actividad se desarrollaba en forma manual, pero ahora, con la gran cobertura de sistemas de video vigilancia, la tendencia es automatizar esta actividad con la ayuda de sistemas de cómputo dotados con algoritmos para el reconocimiento de patrones. El funcionamiento de los cuales se basa en el uso de técnicas de segmentación, de estimación de movimiento, de extracción del fondo de la escena, etc. Es importante mencionar que la gran mayoría de estas técnicas operan sobre conjuntos de píxeles, es decir en flujos de video no comprimidos o video en bruto (e inglés: raw video). Aquí surge un detalle a considerar, las cámaras de video vigilancia convencionales no generan video en bruto sino video comprimido, el cual presenta, entre otros, distorsiones y pérdida de información. Así, aplicar estos algoritmos al video comprimido requiere, primeramente, descomprimir totalmente el video, después, evaluar si las imperfecciones del video comprimido no afectan el desempeño de los algoritmos propuestos. En esta tesis de maestría se propone utilizar informaciones directamente disponibles en el video comprimido, que no son píxeles, sino informaciones particulares (coeficientes frecuenciales y vectores de movimiento), para realizar la clasificación de objetos que aparecen en la escena de video, tales como personas, vehículos, animales, etc. El uso de estas informaciones debe beneficiar considerablemente el ahorro de recursos de cómputo y hacer más directo el proceso de reconocimiento en video comprimido. Además, el trabajo que aquí se propone toma como referencia un trabajo previo [3]. 4. Objetivos generales y específicos del proyecto de investigación Objetivo general: Encontrar un algoritmo que permita distinguir y clasificar los diferentes objetos que aparecen en una escena de video comprimido. Objetivos particulares - Comprender diferentes tecnologías para efectuar la codificación de video. - Conocer diferentes técnicas para el análisis de imágenes. - Obtener un algoritmo para clasificar objetos basado en la información frecuencial y temporal, ambas presentes en el flujo de video comprimido. El algoritmo debe ser de bajo costo computacional. 5. Metodología propuesta a) Análisis del estado del conocimiento en propuestas similares poniendo una particular atención a las herramientas matemáticas de base. b) Estudio de las técnicas de codificación de video. c) Prueba de diferentes técnicas para el análisis de imágenes, tanto en el terreno frecuencial, como en el temporal. d) Selección de una norma de compresión de video sobre la cual se desarrollará el algoritmo. e) Propuesta de un algoritmo para la clasificación de objetos. f) Pruebas de desempeño. g) Elaboración de un artículo de investigación. h) Redacción de la Idónea Comunicación de Resultados. 6. Resultados esperados a) Un algoritmo para la clasificación de objetos partir de informaciones frecuenciales y de movimiento. c) Un artículo de investigación. 7. Referencias a la literatura inicial [1] Antonini, G., Thiran, J.P., “Counting Pedestrians in Video Sequences Using Trajectory Clustering”, CirSysVideo(16), No. 8, August 2006, pp. 1008-1020. [2] Teixeira, T., Savvides, A., “Lightweight People Counting and Localizing in Indoor Spaces Using Camera Sensor Nodes”, ICDSC07. [3] Gustavo Flores Chapa, “conteo de personas en video H.264”, tesis de maestría, Universidad Autónoma Metropolitana, 2011. 8. Calendarización de actividades Trimestre Actividad 1er 1 2 Análisis de estado del conocimiento Estudio de técnicas para la codificación de video Propuesta inicial de un algoritmo de clasificación. Presentación oral del protocolo de investigación. Prueba de técnicas selecionadas. Presentación oral del protocolo de investigación. Integración de un sistema de clasificación. Elaboración de articulo de investigación Redacción de la Idónea Comunicación de Resultados 9. Infraestructura necesaria y disponible 1. Cámara de alta resolución (1440x1080 píxeles). 2. Secuencias de video conteniendo objetos en movimiento. 10. Lugar de realización Edificio T, Sala 329 bis. 2do 3 1 2 3er 3 1 2 3