INTRODUCCIÓN
Es ampliamente conocido que los actuales flujos de trabajo producción de contenidos de TV, es su ciclo de vida que cubre desde su captura hasta la visualización en el usuario final, se ven inmersos en varios ciclos de codificación y decodificación. Por lo general, el contenido es grabado en el origen de la noticia (ENG o EFP) sobre un formato de producción de alta calidad como DNxHD, ProRes, AVC-I, o XDCAM HD, o bien es transmitido hasta los estudios de TV en directo a través de las redes de contribución, utilizando alguno de los estándares de compresión de video como MPEG-2, H.264 o incluso el recientemente aprobado HEVC.
Es muy probable que el contenido sea nuevamente recodificado para su edición y post-producción, e incluso re-codificado una vez más en un formato de compresión distinto, para su reproducción de los servidores de playout. La última etapa de re-codificación que sufre el contenido es aplicado en el proceso de emisión, acorde con los distintos estándares de difusión del DVB. Este proceso de multi-generación provoca unas pérdidas de calidad que degradan el contenido de modo progresivo, debido por un lado al uso esquemas de compresión con pérdidas, pero también por factores adicionales como la conversión de espacios de color, la utilización de formatos con submuestreo 4:2:0, el reescalado de la imagen, o incluso la utilización de distintos tamaños de GOP y de tasas binarias. En consecuencia, la calidad del contenido debe mantenerse tan elevada como sea posible en los centros de producción de TV, con el objetivo de asegurar que la calidad que percibe el usuario final es la adecuada.
Una de las practicas más extendidas para los procesos de edición y contribución, es el uso del formato de submuestreo de croma 4:2:2 , el cual asegura una alta fidelidad del color a lo largo de toda la cadena de producción. Por otro lado, la etapa de distribución utiliza un formato de submuestreo de color 4:2:0, ya que dicho contenido no va a verse sometido a nuevos procesados. La Figura 1 muestra a modo de ejemplo, un escenario habitual de producción de TV, con dos servicios de contribución utilizando el formato 4:2:2, seguido del servicio de difusión a través de las habituales redes de DTH, TDT y OTT, soportando el formato de submuestreo 4:2:0.
Con el objetivo de cuantificar las pérdidas de calidad debidas a la multigeneración de codificaciones, hemos llevado a cabo distintas simulaciones con tres etapas re-codificación utilizando el perfil «High 422» de H.264. La figura 2 muestra los resultados de la calidad (promedio de luminancia y crominancia) obtenida en cada una de las tres generaciones, para un amplio rango de tasas binarias, utilizando secuencias de alta definición. Se puede comprobar cómo la calidad se degrada en cada generación, en especial para las tasas binarias utilizadas generalmente para los servicios de contribución en alta definición, entre 10Mbps y 30Mbps.
De igual modo, se puede observar como la primera (1g) generación obtiene una calidad de 36dB (PSNR) para un tasa binaria de 17Mbps, mientras que la tercera generación (3G) necesitaría utilizar una tasa binaria de 24Mbps para alcanzar la misma calidad de 36dB, lo cual significa que debería incrementar un 40% su tasa binaria con respecto la primera generación. Esta es la razón por la cual los radiodifusores y operadores de red deberían tener presente las pérdidas producidas por la concatenación de etapas de codificación en el diseño y arquitectura de sus redes, con el objetivo de ofrecer un servicio de alta calidad.
¿Es el formato 4:2:0 más eficiente que el 4:2:2 para los servicios de contribución?
Está muy extendida la idea de que la codificación con formatos 4:2:0 es mas eficiente que la 4:2:2, para escenarios de con fuertes restricciones de ancho de banda, tales como las conexiones en directo para informativos en HD, o las contribuciones de baja calidad. Este argumento se basa en la premisa de que los formatos 4:2:0 requieren una menor tasa binaria, lo cual es cierto, pero es igualmente cierto que la calidad del color con submuestreo 4:2:0 ve decrementa debido a la reducción de su resolución. El submuestreo del color podría ser una Buena solución si al contenido no le fuera aplicado ningún procesado adicional, pero el escenario real en los centros de producción es que los contenidos son convertidos nuevamente al dominio 4:2:2 para ser transportados por los interfaces SDI/HD-SDI, para facilitar su conectividad con el resto de dispositivos como mezcladores de vídeo, generadores de DVR, insertadores de logotipo, y cualquier otro dispositivo de producción.
A pesar de la reciente aprobación de recomendaciones internacionales como la SMPTERP2050, que define determinados filtros de reconstrucción perfecta para la conversión 4:2:0/4:2:2, las pérdidas de alteas frecuencial provocadas por el proceso de submuestreo de las componentes de color de 4:2:2 a 4:2:0, no pueden ser evitadas de ningún modo. Con el objetivo de analizar la calidad del formato 4:2:0 en un escenario real de multigeneración dónde los codificadores son conectados a los decodificadores pro medio de interfaces digitales SDI en formato 422, hemos repetido los test para tres etapas ciclos de re-codificación utilizando los perfiles 420 de H.264 y HEVC. En la figura 4 se muestran los resultados para la tercera generación con el perfil “Main10” de HEVC, presentando la calidad de la componente de luminancia a la izquierda y de la componente de color (V) a la derecha.
Se puede observar cómo la componente de luminancia para el formato 4:2:0 tiene un aligera ganancia con respecto al formato 4:2:2, debido a que parte del presupuesto de bits que es necesario asignar a la componente de color, al tener esta menor resolución, es utilizado para la codificación de la componente de luminancia. Por el contrario la calidad de la componente de color par el formato 4:2:0 es 1 dB inferior a la obtenida con el formato 4:2:2. Este hecho evidencia la penalización en términos de calidad que se produce si las contribuciones son llevadas a cabo con el formato 4:2:0. Con respecto a la codificación con el perfil “High” de H.264, la figura 5 muestra el resultado de los test para la componente de color (U), para las tres generaciones evaluadas, dónde se puede observar la degradación progresiva de la calidad para el formato 4:2:0 comparado con la codificación en 4:2:2. Aun cuando las pérdidas de calidad del color caen aproximadamente 1.5dB para la primera generación , su calidad se ve degradada drásticamente para la tercera generación con unas pérdidas próximas a los 3 dB.
CONCLUSION
Este documento analiza el impacto en términos de calidad, de la concatenación de distintas etapas de re-codificación que se producen en los entornos profesionales de contribución, para los estándares H.264 u HEVC.
Los resultados muestran como la utilización de perfiles 4:2:0 obtienen una pero calidad comparados con la utilización de los perfiles 4:2:2, para ambos estándares.
Utilizando H.264, la degradación del color es superior a 1dB para la primera generación, y podría incrementarse hasta los 3dB para la tercera generación.
Las pérdidas de calidad del color para el perfil 420 de HEVC, se mantiene constante en 1dB, para todas las generaciones, mostrando una mayor robustez que H.264.
Por consiguiente, los operadores de red y los radiodifusores tiene que ser conscientes de las implicaciones que conllevan los escenarios de multigeneración con el objetivo de reducir las pérdidas de calidad, así como de la degradación del color que puede suponer la utilización del formato 4:2:0 para escenarios de contribución.
Departamento de i+D de Sapec
Formato_mas_eficiente.pdf
Cuadro 1. Escenario de multigeneración en la cadena de producción Cuadro 2. Resultados de la calidad obtenida para tres generaciones, utilizando el perfil «High 422» de H.264 Cuadro 3. Arquitectura de los test de contribución en 420 Cuadro 4. HEVC performance for 4:2:2/4:2:0 encoding Cuadro 5. H.264 performance for 4:2:2/4:2:0 encoding