2016-01-12 (parcial 2)
Transcripción
2016-01-12 (parcial 2)
SSR DEPARTAMENTO DE SEÑALES, SISTEMAS Y RADIOCOMUNICACIONES Televisión (GITST) - 2a parte 12 de enero de 2016 Apellido(s): Nombre(s): Grupo: Pregunta 1 (1 punto) Dibujar el esquema básico de un codificador de vı́deo hı́brido predictivo-transformacional genérico, especificando tanto sus principales bloques como sus datos de entrada y salida. Imágenes de entrada Bits de salida + DCT Q Codificación Q -1 DCT Estimación movimiento + Compensación movimiento -1 + Buffer Vectores de movimiento Pregunta 2 (1 punto) Indicar el resultado de aplicar sobre el bloque de coeficientes cuantificados mostrado a la derecha la fase 1 de la codificación VLC-2D que se utiliza en la recomendación H.261. (0,6) (0,-2) (0,2) (0,1) (1,3) (2,1) (0,2) (0,-1) (1,1) (0,-2) (0,1) (0,-1) EOB. 6 -2 3 0 2 0 0 1 1 2 1 -1 0 0 -2 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Pregunta 3 (2 puntos) Se codifica una secuencia de 5 s y 125 imágenes de resolución CIF (288×352 pı́xeles) según el estándar MPEG-1, usando GOPs con N=8 y M=2, y buscando una velocidad binaria objetivo de 0,8 Mb/s. Indicar: a) La estructura del primer GOP codificado, y la del resto de GOPs. Primer GOP: IBPBPBP; resto: BIBPBPBP. b) El orden de codificación de las imágenes 0 a 10. 0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9. c) El número de bits que se asignarán, a priori, a cada tipo de imagen en cualquier GOP distinto del primero. Despreciando la diferencia de estructuras del primer GOP y los demás, a cualquier GOP de ocho imágenes le corresponde un presupuesto binario total de 0,8 Mb/s · 5/125 s/im · 8 im = 256 kb, que se debe repartir entre su imagen I, sus tres P y sus cuatro B. Llamando xI,P,B a los números de bits asignados a priori a las imágenes I, P y B respectivamente, se debe cumplir pues que xI + 3 xP + 4 xB = 256 kb. Imponiendo además que xI = 2 xP = 3 xB , se llega a: xI = 66,78 kb; xP = 33,39 kb; xB = 22,26 kb. Pregunta 4 (2 puntos) Responder a las cuatro siguientes cuestiones sabiendo que, para cada una, la única respuesta correcta sumará 0,5 puntos a la nota final, pero cualquiera de las dos erróneas le restará 0,25 puntos. a) En MPEG-2: ✕ El modo campo se puede usar con secuencias en formato entrelazado o progresivo. ✓ El modo cuadro se puede usar con secuencias en formato entrelazado o progresivo. ✕ El modo cuadro sólo se puede usar con secuencias en formato progresivo. b) En la capa de sistema de MPEG-2: ✓ Los ESs no mezclan datos de audio y vı́deo, pero los PESs sı́. ✕ Los PESs no mezclan datos de audio y vı́deo, pero los ESs sı́. ✕ Ni los ESs ni los PESs mezclan datos de audio y vı́deo. c) En AVC: ✕ La transformación se aplica siempre sobre bloques de 4×4 muestras. ✕ No se permite ningún tipo de predicción en las imágenes de tipo I. ✓ La predicción se puede realizar con una precisión de 1 4 d) En HEVC: ✓ El tamaño mı́nimo de una CTU es de 16×16 pı́xeles. ✕ La CTU es la unidad básica a nivel de codificación. ✕ Las raı́ces de las TUs son las PUs. pı́xel. Pregunta 5 (1 punto) Las imágenes de la derecha corresponden a una secuencia de vı́deo y su secuencia de profundidad asociada, ambas de la misma resolución espacial y temporal, y ambas comprimidas con un mismo codificador AVC configurado idénticamente. Razonar cuál de ellas tiene menor velocidad binaria. La secuencia de profundidad tiene menor velocidad binaria porque no contiene información de crominancia ni texturas detalladas (una imagen de profundidad tiene, principalmente, zonas homogéneas y bordes abruptos en los lı́mites de los objetos). Pregunta 6 (1 punto) En un sistema de codificación que utiliza la capa I de MPEG-1, el modelo psicoacústico ha estimado el nivel de presión sonora en 75 dB y el mı́nimo umbral de enmascaramiento en 25 dB. Calcular, utilizando la tabla de la norma que se adjunta: a) El mı́nimo número de bits necesario para codificar las muestras de modo que el ruido de cuantificación quede enmascarado. b) El mı́nimo umbral de enmascaramiento que deberı́a haber para que el ruido de cuantificación fuese inaudible codificando las muestras con 3 bits. bits 2 3 4 5 6 7 8 9 10 11 12 13 14 15 SNR (dB) 7,00 16,00 25,28 31,59 37,75 43,84 49,89 55,93 61,96 67,98 74,01 80,03 86,05 92,01 A 0,750000000 0,875000000 0,937500000 0,968750000 0,984375000 0,992187500 0,996093750 0,998046875 0,999023438 0,999511719 0,999755859 0,999877930 0,999938965 0,999969482 B -0,250000000 -0,125000000 -0,062500000 -0,031250000 -0,015625000 -0,007812500 -0,003906250 -0,001953125 -0,000976563 -0,000488281 -0,000244141 -0,000122070 -0,000061035 -0,000030518 a) El ruido de cuantificación queda enmascarado si la SNR es mayor que la SMR (relación señal a máscara), o sea, si la MNR (relación máscara a ruido) es positiva. En este caso, SMR = 75-25 dB = 50 dB, por lo que se debe usar al menos 9 bits (SNR = 55,93 dB > SMR). b) Codificando con 3 bits, SNR = 16 dB, luego debe ser SMR < 16 dB, y el umbral de enmascaramiento M > 75-16 dB = 59 dB. Pregunta 7 (2 puntos) Se considera la transmisión vı́a satélite de varios servicios digitales según la multiplexación contemplada en el estándar europeo DVB-S, y usando un transpondedor con un ancho de banda BW = 27 MHz, pulsos en coseno alzado con factor de roll-off α = 0,35, modulación QPSK, CC (Codificación de Canal) exterior Reed-Solomon RS(204,188), y CC interior convolucional sin perforado (puncturing) con una tasa de código RC = 21 . a) Calcular las velocidades binarias bruta (Vbb ) y neta (Vbn , descontando la CC) disponibles en el canal, y su eficiencia espectral neta (ηn ). Vbb = 27 · 106 BW nb = 2 = 40 Mb/s (para QPSK, nb = log2 4 = 2 b/sı́mbolo) 1+α 1, 35 ⇒ Vbn = Vbb 188 Vbn 18, 43 RC = 18,43 Mb/s ⇒ ηn = = ≃ 0,68 (b/s)/Hz. 204 BW 27 b) Ahora se introduce perforado en la etapa de CC interior, de forma que se puede variar RC entre los valores contemplados por DVB-S: RC ∈ { 12 ; 32 ; 34 ; 65 ; 87 }. Si se debe multiplexar N = 6 servicios en el canal y cada uno de ellos necesita una velocidad binaria mı́nima Vs = 4,5 Mb/s, calcular el valor de RC que maximizarı́a la protección frente a errores de transmisión. Vbn,min = N · Vs = 27 Mb/s ⇒ RC,min = 3 Vbn,min 204 = 0,73 ⇒ RC = . Vbb 188 4