Standard MPEG-4 La realidad de la TV análogica

Transcripción

Standard MPEG-4 La realidad de la TV análogica
Standard MPEG-4
●
Introducción
●
Funcionalidades
●
Escalabilidad de objetos
●
Codificador-decodificador MPEG-4
●
Codificación de texturas
●
Codificación de contornos
La realidad de la TV análogica
●
La TV análogica ha sido el único sistema de comunicación de video
●
La TV análogica no ha cambiado en los últimos 49 años
●
La TV analógica ha sido el primer sistema de compresión
●
La TV es un sistema de comunicación unidireccional
●
El usuario es un simple espectador
- La TV está cambiando a digital
- El usuario tendrá un papel fundamental
Evolución
●
La TV digital nos conduce a una nueva era en los sistemas de video
●
Los standards de video (MPEG-x, H.26x) mejoran el papel del usuario
●
El usuario puede generar y transmitir su propio contenido
●
MPEG-4 mejorará la capacidad del usuario (objetos)
●
La cantidad disponible de material de video es enorme
●
El usuario querrá crear su contenido a partir de bases de datos
MPEG-1
MPEG-2
MPEG-4
MPEG-7
Cada evolución contiene menos codificación y más análisis
Standards de codificación
ISO
ITU
1984
1986
1988
1990
1992
1994
1996
1998
H.263
H.263+, H.26L
H.261
MPEG-1
MPEG-4
MPEG-2
Ui
Ui
AU i AT
Q
Vi Cuantificador Vi Codificador
Q
Canal
N
Decodificador
entrópico
Canal
Esquema general de codificación
por transformadas - JPEG
ViQ
T
entrópico
Q
A Vi A
UiQ
UiQ
Codificador JPEG 2000
Bit-stream
Decorrelación
componentes
Transformada
wavelet
Reversible
No Reversible
Q
Bit stream
ordering
Region of
interest
Codificación
aritmética
Coefficient bit
modeling
Error
resilience
Esquema general codificación video
Secuencia original
Transformada
Cuantificador
Q
Predicción
temporal
compensada en mov.
Cuantificación
error de predicción
decorrelado
Codificador
entrópico
Error de
predicción
Decorrelación 2D
error de predicción
DCT
Codificador híbrido de video
Control
Información lateral
+
DCT
VLC
Q
Q
-1
Predictor
Estimación
movimiento
Memoria
IDCT
+
+
VLC
MUX
Buffer
Codificación basada en
bloques
Imagen original Akiyo (QCIF)
La unión de dos mundos
TV analógica
1. Compresión de imagen y video
- Esquemas basados en el pixel
- JPEG, H.26x, MPEG-1,2
MPEG-4
2. Análisis de imagen y video
- Segmentación
- Reconocimiento de objetos
Standard MPEG-4
Compresión
Interactividad
basada en
contenido
Acceso universal
Objetos audio-visuales
Video Object Plane - VOP
Audio object planes
Train to
MPEG-4
07:30
Welcome to MPEG-4
Attention
please!
Representación de una
secuencia en VO’s (1)
Representación de una
secuencia en VO’s (2)
Standard MPEG-4 (1)
• Imagen = Objetos + texto + fondo (VO’s)
• Codificación separada de los objetos
• Manipulación de los objetos
+
+
Texto
MPEG-4
Texto
Standard MPEG-4 (2)
●
●
●
●
●
●
●
●
Content-based multimedia data access tools.
Content-based manipulation and bit-stream editing.
Hybrid natural and synthetic data coding.
Improved temporal random access.
Improved coding efficiency.
Coding of multiple concurrent data streams.
Robustness in error prone environments.
Content-based scalability.
Escena MPEG-4
audiovisual objects
voice
hierarchically multiplexed
upstream control / data
audiovisual
presentation
sprite
hierarchically multiplexed
downstream control / data
2D background
y
3D objects
scene
coordinate
system
x
z
user events
audio
compositor
video
compositor
projection
plane
hypothetical viewer
speaker
display
user input
Terminal MPEG-4
Demultiplex
N
e
t
w
o
r
k
...
Decompression
Composition and
Rendering
...
Elementary
Streams
Primitive
AV Objects
...
Scene Description
(Script or Classes)
L
a
y
e
r
Hierarchical, Interactive,
Audiovisual Scene
Composition
Information
Upstream Data
...
(User Events, Class Request, ...)
MPEG-4: Reutilización de contenido
COMPOSITOR
DEMULTIPLEXER
VO #N
MULTIPLEXER
...
CODER
VO #1
DECODER
DB
DB
Codificación de objetos
MPEG-4: SNHC
Synthetic and Natural Hybrid Coding
Codificación híbrida natural y sintética
● Solapamiento (overlay) de texto y gráficos
● Animación de caras y cuerpos
(Facial & body animation)
Realidad virtual
● Conversión Texto voz
● Codificación imágenes 3D (espaciales)
●
Facial Animation Parameter Units
11.5
11.5
11.4
11.4
11.2
11.2
4.4
4.6
11.1
4.2
4.3
4.1
4.4
4.5
11.6
10.2
10.1
10.6
10.7
5.2
y
10.2
10.10
10.3
5.3
5.4
10.8
10.5
5.1
5.4
10.4
10.8
10.6
z
y
x
2.1
2.11
2.12
2.10
z
7.1
2.10
x
5.2
2.13
2.14
4.2
4.6
10.9
10.10
10.4
11.1
11.3
2.14
2.12
2.1
3.13
3.14
3.2
3.1
3.8
3.6
3.12
3.11
3.5
3.7
3.3
3.4
3.10
3.9
Right eye
9.6
Left eye
9.7
9.8
9.12
Nose
9.14
9.10
9.13
9.11
9.3
8.6
2.5
6.2
8.9
9.5
8.10
8.1
2.7
2.2
2.9
2.3
2.6
8.5
8.3
2.4
6.3
8.8
6.1
9.15
9.4
8.4
6.4
9.1
9.2
9.9
Teeth
Tongue
Mouth
2.8
8.7
8.2
Feature points affected by FAPs
Other feature points
Modelo de cara
MPEG-4: SNHC
Synthetic and Natural Hybrid Coding
Multiple concurrent data streams
Escalabilidad basada en
contenido
Capa base
Capa mejora
Escalabilidad de objetos
+
+
VOP 1
Decodificado
VOP 2
Decodificado
+
VOP 3
Decodificado
VOP 4
Decodificado
+
Escena compuesta
Compositor
– Acciones del usuario para definir el compositor
Posición espacial de los objetos
● Tamaño de los objetos
● Prioridades de overlay (orden de fundido de los VOP ’s)
● Selección de los objetos
●
– Se controla a nivel de sistema
– La composición se aplica sucesivamente
MPEG-4 composición
Fondo sintético:
Gráficos:
Transparencia:
Video e
información de
forma:
Jerarquía de clases en MPEG-4
VideoSession (VS)
VS1
VO1
VideoObjec (VO)
VideoObjectLayer (VOL)
GroupOfVOPs (GOV)
VideoObjectPlane (VOP)
VOL1
GOV1
VOP1
VO2
VOL2
GOV2
VOPk
VOP1
VOPk
Grupos Standard MPEG-4
●
●
●
●
●
●
●
●
●
Requirements
Video
Audio
SNHC
Systems
Error resiliance
Test
Implementation No son parte del standard final
Liaison
Estado actual Estándard MPEG-4
•
Marzo 2000:
– Versión 1:
– Versión 2:
•
International Standard
(1999)
Conformance Testing
(2000)
International Standard
(2000)
Video Reference software:
– MoMuSys:
– Microsoft:
implementación en C
implementación en C++
Perfiles y herramientas
Main
Simple scalable
B_VOP Temp. Scal.
Spat. Scal.
Simple
I and P VOPs
ACDC prediction
4MV
Error resilience
H263 compatible
Core
B_VOP
MPEG-2 Quant table
Binary shape
P_VOP shaped TS
N_BIT
4 to 12 bits
Grey shape
Interlaced
Sprite
Compatibilidad MPEG-4
MPEG-4 VLBV Core Coder
Video
Object
Plane
Motion
(MV)
Texture
(DCT)
bitstream
(Similar to H.263/MPEG-1)
Generic MPEG-4 Coder
Video
Object
Plane
Shape
Motion
(MV)
Texture
(DCT)
bitstream
Contenido de vídeo
•
•
•
•
•
•
•
•
•
•
•
Intra and Prediction modes: Extrapolación.
Bi-directional mode: Interpolación.
Binary shape: Basado en bloques (CAE).
Alpha maps: Técnicas de textura.
I/P/B VOs: Extrapolación.
Temporal and Spatial scalability.
Static Sprites: Concepto de panorama.
Error resilience tools: Canales móviles.
Interlaced tools: TV estándar.
12 bit video: Aplicaciones médicas.
Compatibilidad H263: Perfile simple
Mejoras del block matching
Incorpora técnicas avanzadas de BM:
• Precisión de medio o cuarto de píxel.
• Posibilidad de subdividir el bloque (16x16) en 4 subbloques (8x8).
• Bloques totalmente solapados.
• Vectores de movimiento no restringidos sobre la
imagen.
VO acumulado Sprites
VO acumulado
Porción visible en un instante dado
1
3
4
5
2
VO acumulado - Sprites
La idea es análoga a la utilización de fondos
en dibujos animados.
VO acumulado - ejemplo
VO acumulado - manipulación de
objetos
Manipulación de objetos - sprites
Herramientas externas al
estándar
●
●
●
●
●
●
Creación de los Video Objects.
Creación de los Sprites.
Técnicas de Bit allocation.
Técnicas de Rate control.
Métodos de composición.
Métodos de interactuación.
Codificación
VOP n
Decodificación
VOP 1
Decodificación
VOP 2
Decodificación
VOP n
Interacción del usuario
Composición
de VOP’s
Codificación
VOP 2
Demultiplexador
Codificación
VOP 1
Multiplexador
Control de codificación
Formación
de VOP’s
Información de video
Diagrama general MPEG-4
Codificador MPEG-4
motion
texture
coding
+
_
DCT
Q
video
multiplex
-1
Q
IDCT
+
+
S
w
i
t
c
h
pred. 1
pred. 2
Frame
Store
pred. 3
Motion
estimation
Shape
coding
Técnicas de codificación MPEG-4
Codificación de textura
Codificación de contornos
Codificación de movimiento
* MPEG 4 no proporcionará la segmentación para
obtener VO’s
Codificación de los VO’s
Video sequence
VOP 1
Codificación de
contornos
Codificación de
textura
Formación del VOP
VOP 2
Codificación de
movimiento
VOP 3
VOP n
Codificación de textura
VOP
8x8 DCT
8x8 DCT con padding
No se codifica
Cuantificación
●
Método 1: Similar a H.263
●
Metodo 2: Similar a MPEG-2
●
Cuantificación no lineal optimizada de los coeficientes DC
●
Matrices de cuantificación y mecanismo de carga
Shape adaptive DCT (Fase 2)
Codificación wavelet
●
Generalización de la transformada wavelet a VO’s de forma arbitraria
●
Número de coeficientes transformados en el VO =
= Número de pixels en el VO
●
Generalización del codificador zero-tree
Codificación de contornos (1)
Creación del Bounding Box
Codificación de contornos (2)
ALL-0 BAB
ALL-255 BAB
Parcialmente incluido
Binary Alpha Blocks (BAB)
BAB’s parcialmente incluidos (1)
Codificación intra:
Dentro del Macrobloque actual, se realiza una
predicción del valor de cada píxel basada en
un contexto causal: Intra CAE
BAB’s parcialmente incluidos (2)
Codificación inter:
Se estima el movimiento y se analiza si se
debe utilizar o no.
Se codifica el error de estimación mediante
Inter CAE.
Contexto en la
imagen actual
Contexto en la
imagen precedente
Compensación de movimiento
Modos de compensación
P-VOP
time
B-VOP
I-VOP
Herramientas “error resilience”
Picture Start Code
MPEG4 Resync Marker
H.263 Resync Marker
Bit stream H.263
Bit stream MPEG-4
Más información
MPEG4 standard
http://drogo.cselt.stet.it/mpeg/standards/mpeg-4/mpeg-4.htm
MPEG4 IEEE Spectrum
http://drogo.cselt.stet.it/mpeg/koenen/mp4ieee.htm
MPEG4 Industry Forum
http://www.m4if.org/

Documentos relacionados