Analyzing video object motion focusing on non

Transcripción

Analyzing video object motion focusing on non
Analyzing video object motion focusing on non-planar
rotation for two video applications
Alejandro Ramirez Pilimtec R&D, France
Mireya García IPN-CITEDI Tijuana
http://www.tijbc.com
CIC 2006
24 Noviembre 2006
[email protected]
[email protected]
Hechos
Necesidad de interacción con el
contenido multimedia
Necesidad creciente en
herramientas de análisis :
Contenido
Movimiento:
Problemática
3D
2D: Modelos adecuados
3D
X
I
C
Z
Y
Modelización 2D
2D
Análisis
de imágenes
Compresió
de imágene
Motivación
Modelos clásicos : translacional (tx,ty), afin(..)
Considera movimientos de translación, de zoom y de rotación 2D
Considera rotaciones llamadas « no-planas » :
Pocos trabajos [Thompson84,Shariat86,Jurgen00,GaNi2003]
Plan
Análisis del movimiento aparente
Noción de video objeto
Descripción y clasificación del movimiento aparente:
Movimiento plano
Movimiento no-plano
Análisis del movimiento no-plano
Aplicación a la compresión
Conclusiones y perspectivas
Análisis de movimiento
Categorias de análisis de movimiento :
Estimación del movimiento 3D
Parámetros 3D (información a priori)
Reconocimiento de objetos
Estimación del movimiento 2D
Movimiento relativo, no modelización 3D
Plan
Análisis del movimiento aparente
Noción de video objeto
Descripción y clasificación del movimiento aparente:
Movimiento plano
Movimiento no-plano
Techniques d’analyse de mouvement non-plan
Applicación a la compresión
Conclusiones y perspectivas
Noción de video objeto
MPEG4
Plan
Análisis del movimiento aparente
Noción de video objeto
Descripción y clasificación del movimiento aparente:
Movimiento plano
Movimiento no-plano
Análisis del movimiento no-plano
Applicación a la compresión
Conclusiones y perspectivas
Descripción y clasificación del movimiento
Movimiento Plano:
Rotaciones 2D
Variaciones de focal
Translaciones 3D
(amplitud pequeña/distancia escene-cámara)
Sin movimiento
Rotación 2D
Movimiento No-Plano:
Rotaciones no-planas
Translaciones 3D
(grandes amplitudes/distancia objeto-cámara)
Rotaciones no-planas
1
Descripción y clasificación del movimiento
P1
mNP4
mNP1
mP5
Detección y Análisis de cambios
de orientación
mP4
mP2
mNP2
mNP3
mP3
mP = movimiento plano
NP = movimiento no- plano
mP1
mNP1
mP2
mNP2
mP3
1
Hipótesis
Rigidez de los video objetos
Gran amplitud del movimiento relativo objeto/cámara (marcos alejados).
Sin variación de iluminación sobre los video objetos considerados.
Las máscaras binarias de los video objetos se suponen conocidas
1
Plan
Análisis del movimiento aparente
Noción de video objeto
Descripción y clasificación del movimiento aparente:
Movimiento plano
Movimiento no-plano
Análisis del movimiento no-plano
Applicación a la compresión
Conclusiones y perspectivas
1
Esquema principal
- VOPS Originales
- Máscaras de los VOPs
Estimación de la translación
Análisis de
movimiento
plano
Estimación de la divergencia
Estimación de la rotación
Modelo de movimiento plano
válido
Evaluación
de la
calidad en
similaridad
Modelo de movimiento plano
no-válido
Estimación de la dirección
del eje de rotación
no-plano
Estimación del ángulo
del eje de rotación
no-plano
Análisis del
movimiento
no-plano
1
Algunos resultados
Pm
NPm
kI11
kI
NPm
kI44
kI
NPm
NPm
kI55
kI
NPm
kI99
kI
NPm
kI15
kI11
kI
11
Pm
kI17
Pm
kI14
kI
14
Pm
kI19
kI20
kI22
C r it e r io n
Criterio
Critère
C4
70
60
50
40
30
20
10
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Images clés
k I = K e y Im a g e s
1
Modelización del movimiento no-plano
Hipótesis
Rigidez de los video objetos
Rotación non-plana: el eje pasa por el centro de gravedad
Proyección: perspectiva
1
Modelización del movimiento no-plano(NPR)
Parámetros a estimar: Φ
α
 x2 (Φ )   cos Φ − sin Φ  x2 

=
 
y
(
Φ
)
sin
Φ
cos
Φ
 y 2 
 2
 
y2’
Φ
P
x2 − xg 2 =
cos α ( x1 − xg1 )
sin α
1−
( x1 − xg1 )
f
p’
x2 ’
Y
focal
X
Z
Centro de proyecció
Plano de proyección
( y1 − yg1 )
y2 − yg 2 =
1−
sin α
( x1 − xg1 )
f
f =
CCD sensor avec ( pixels ) / 2 [Shar99]
tan( horizontal field of view / 2)
1
Estimación de la dirección del eje de rotación
Y
Φ : Eje de rotación
AP: Eje perpendicular
Y
Φ
S ( A1) S ( B1)
=
S ( A2) S ( B 2)
A1
A2
Θ
X
B1
B2
AP
2
 S(A1) S(B1) 
Φ= argmin
−


θ=−90.+90o S(A2) S(B2)
1
Algunos resultados
Pm
NPm
NPm
NPm
Pm
Pm
Pm
S
Pm
Pm
NPm
NPm
NPm
NPm
NPm
NPm
S
1
Estimación del ángulo de rotación
α = arg min (VOP1 (α ) − VOP 2 (α ))
α = −180+180°
Couples VOP Angle réel Angle estimé
9
7
VOP1-VOP6
VOP1-VOP7
VOP1-VOP8
VOP1-VOP9
10
13
14
8
15
11
2
Conclusión Parcial
Método de cálculo rápido de los parámetros
Sensibilidad a errores de segmentación
Buena discriminación de movimientos planos et no-planos si
la calidad de segmentación no es tan mala
la amplitud del movimiento no-plano es suficiente
Estimación estable temporalmente del eje de rotación
2
Plan
Análisis del movimiento aparente
Noción de video objeto
Descripción y clasificación del movimiento aparente:
Movimiento plano
Movimiento no-plano
Análisis del movimiento no-plano
Aplicación a la compresión
Conclusiones y perspectivas
2
Aplicación a la compresión
El problema:
Los algoritmos clásicos: compensación de movimientos planos
Mejora propuesta:
Utilización del modelo NPR para permitir la compensación de
movimientos no-planos.
r
r r
P ' = RP + D
Ty
Φ
α
Tx
arámetros de rotación no plano
2 parámetros de translación
VOP referencia
VOP a predecir
2
Principio del algoritmo de estimación de movimiento
bloc référence
Etapa 1
Estimación
parámetros
de translación
Tx,Ty
bloc courant
Φ
α
Etapa 2
Estimación
parámètros
de rotación no-plano
bloc référence
bloc courant
Etapa 3
Refinamiento
de 4 parámetros
Tx,Ty,Φ,α
2
Aplicación a la compresión:
Algunos resultados
Con Block Matching
Con el modelo NPR
239
225
211
197
183
169
155
141
127
113
99
85
71
57
43
29
15
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
1
PSNRgain (dB)
Foreman( frame 7-9)
Number of blocks
2
Aplicación a la compresión: Algunos resultados
Con Block Matching
Con el modelo NPR
Tai (frame 5-7)
3
2.5
2
1.5
1
0.5
188
177
166
155
144
133
122
111
100
89
78
67
56
45
34
23
12
0
1
PSNRgain(dB)
4
3.5
Number of blocks
2
Aplicación a la compresión:
Algunos resultados
Con Block Matching
Con el modelo NPR
2
Costo de compresión
Parámetros a codificar : estimación de movimiento plano
Textura : imagen de error
Movimiento : 2 vectores por bloque
Parámetros a codificar : estimación de movimiento no plano
Textura: Imagen de error
Movimiento: mov. Plano + 2 vectores por bloque
(utilización de bandera)
Forma:máscara binaria (approche objets)
2
Conclusión
Clasificación del movimiento: plano ó no-plano
Aproximación geométrica
Algoritmo rápido
Limitaciones
Rotaciones de amplitud pequeña: Detección dificil
Necesario contar con las máscaras de los objetos
Aplicación a la compresión
Mejora a la técnica de estimación de
movimiento
2

Documentos relacionados