viernes, 4 de febrero de 2011

Anexo III: Transmisión diferenciada de vídeo MPEG-4 sobre UMTS

Área de interés: Sistemas y Tecnologías de Radiocomunicaciones

Resumen. En este artículo se analiza la sensibilidad de los diferentes tipos de
información que componen un servicio de video streaming MPEG4 (e.g.
descomposición en tramas I y P) y se propone un esquema de transmisión sobre
UMTS basado en la utilización de múltiples servicios portadores (múltiples
contextos PDP) adaptados a los componentes principales de dicho servicio. Dicha
solución permite aumentar considerablemente el número de usuarios de video
streaming en la red frente a la solución habitual de transportar un determinado
servicio a través de un único servicio portador (i.e. contexto PDP) con los
parámetros de QoS adecuados. El estudio se ha realizado con la ayuda de un
emulador de UMTS y herramientas de estimación subjetiva de la calidad de video.

Introducción

El rápido crecimiento de las redes móviles, como 802.11 o las redes celulares,
unido a una gran demanda de servicios audiovisuales por parte de los usuarios,
está impulsando a ofrecer servir contenidos multimedia en cualquier lugar,
momento y adaptándose a los diferentes dispositivos “anytime ,anywhere,
any device”. En este contexto, la red celular de tercera generación UMTS
representa un claro exponente en la provisión de servicios audiovisuales como la
video llamada o la descarga en streaming de vídeos.

Partiendo de los modelos clásicos de capas, como el modelo OSI, las redes de
comunicaciones móviles han tenido que reformar los protocolos de red existentes,
pensados para redes de cableado fijo, para adaptarse a las redes móviles
caracterizadas por altos retardos, perdidas elevadas, limitaciones en
capacidad computacional de los terminales y un largo etcétera que ha concluido
con una arquitectura multicapa poco optimizada en algunas ocasiones. Por otro
lado gran demanda de servicios de audiovisuales esta provocando la aparición de
soluciones (modelos cross-layer) destinadas a mejorar este modelo multicapa,
donde se debe optimizar cada elemento de la cadena para poder ofrecer con
calidad el mayor número de servicios posibles minimizando los recursos de red
necesarios para ofrecer dicho servicio.

Centrándonos en las aplicaciones de vídeo encontramos diferentes servicios como
la videollamada, descarga en streaming de pequeños contenidos multimedia,
video vigilancia y toda una serie de servicios donde intervienen una gran cantidad
de elementos a optimizar. Para optimizar estos servicios de video poseemos dos a
aternativas básicas de trabajo: optimizar el algoritmo de compresión, y optimizar el
transporte de la información durante el transporte por la red, siendo la segunda
alternativa el objeto de estudio del presente estudio.

En el artículo se hace hincapié en los estándares de compresión de vídeo
recomendados por el 3GPP contrastando las recomendaciones con las propuestas
por de los fabricantes de terminales móviles.

También se incluye algunas el análisis de las especificaciones técnicas de algunos
terminales para enmarcar las recomendaciones analizadas. Así pues, partiendo
del formato de la información a servir y con el objetivo de seguir las
recomendaciones se propone un modelo donde se optimiza la prestación de
servicios audiovisuales, maximizando la calidad observada por el usuario,
relacionándolo los recursos de red necesarios para ofrecer dicha calidad,
centrándonos en especial en la tecnología de tercera generación
(UMTS) para terminales móviles.

Servicios Portadores de datos en UMTS

Los servicios portadores de datos ofrecidos por UMTS admiten múltiples
configuraciones (clase de servicio, tasas binarias, etc.) a la hora de establecer
cómo un determinado servicio (e.g. video streaming) puede soportarse en la red.
A modo de ejemplo en la Tabla 1 se ilustran las clases de servicio especificadas
en UMTS junto con los parámetros de QoS más relevantes de cara a habilitar la
provisión de un determinado tipo de servicio.


Tabla 1. Ejemplo de configuraciones típicas de servicios portadores en
UMTS.

Los servicios portadores se gestionan mediante los denominados contextos PDP
(Packet Data Protocol). Un contexto PDP es la información almacenada en los
distintos elementos involucrados en un momento dado en el trayecto de
comunicación asociado a una sesión de datos entre el móvil y la pasarela de la
red UMTS (GGSN). En el establecimiento del contexto PDP se indican los
parámetros de QoS necesarios así como los filtros de tráfico que van a identificar
qué información debe encaminarse a través de dicho contexto.

Un esquema habitual suele ser transportar un determinado servicio únicamente a
través de un servicio portador (e.g. un contexto PDP) con los parámetros de QoS
adecuados. No obstante, no toda la información enviada a través de un único
servicio portador tiene porque tener la misma relevancia a la hora de determinar la
calidad con la que se ofrece el servicio y, por tanto, las características de QoS del
servicio portador deben adaptarse a las restricciones de la información más
sensible dentro del flujo de datos.

Soporte de vídeo en terminales móviles.

Los fabricantes de teléfonos móviles y los proveedores de contenidos han
redactado una serie de normativas a través del 3GPP para definir los formatos de
la información que han de soportar los dispositivos móviles. A continuación
realizamos un breve resumen en formato tabla de los aspectos más importantes a
la hora de codificar audio y video.

Conversational Streaming Interactive Background

Tabla 2. Resumen de códecs soportados.


Analizando la tabla anterior podemos concluir que el códec utilizado y
recomendado por ambas entidades es el H.263 perfil 0. El perfil 0 nos define
unas restricciones en cuanto a las herramientas técnicas a utilizar para la
compresión del video, resumiéndose en las siguientes características.

  • Perfil muy sencillos y de baja complejidad.
  • Posibilidad de predicción mediante frames del tipo I y P, únicamente.
  • No se necesitan buffer para la posible decodificación.

Todos los códecs anteriormente mencionados se basan en el aprovechar modelos
de predicción temporales y espaciales, con lo que finalmente codifican toda la
información utilizando códigos entrópicos, con lo que se reduce el número de bits
necesarios para codificar la información.

Del proceso de codificación se obtienen los flujos elementales “ES”. Si nos
centramos en el ES visual se generan las imágenes intra (I) e inter (P o B). Las
imágenes I son fotogramas de gran longitud que contienen en ellos mismos toda
la información necesaria par decodificarse. Por el contrario los frames tipo P
codifican información diferencial respecto las imágenes I. Estas características
justifican la necesidad de proteger los fotogramas I respecto P.

Esquema propuesto

En el presente trabajo se propone la transmisión de un servicio de streaming de
video MPEG4 sobre varios contextos PDP adaptados a las diferentes
características del contenido transportado. La solución planteada propone
descomponer el video en varios flujos en función de la importancia que represente
el contenido del paquete para la calidad final del vídeo. Una vez conocido el
contenido del paquete mediante un filtraje, cada paquete es transportado por el
contexto PDP que mejor se adapte a sus necesidades.

En la Ilustración 1 se presenta el contenido de un vídeo como una combinación de
audio, imágenes comprimidas e información adicional. También se puede observar
una diferencia entre el tipo de imagen generada, factor que permitirá diferenciar el
tipo de imagen y priorizarla en función de la importancia que representa dicha
imagen para la calidad final del vídeo.



Ilustración 1- Arquitectura propuesta para servicios de video sobre UMTS.

Dicha separación permite acomodar mejor las características de los servicios
portadores a la relevancia de la información transportada. Dicha optimización es
especialmente relevante en la componente del servicio portador ofrecida sobre la
red de acceso radio UTRAN, denominada Radio Access Bearer (RAB), donde
una relajación de las restricciones de QoS necesarias deriva directamente en un
aumento de capacidad.

Montaje experimental y Resultados provisionales

En la Ilustración 2 – Escenario de pruebas se muestra el montaje
experimental utilizado en el presente estudio. A continuación presentamos cada
uno de los componentes, especificando brevemente sus funciones a realizar.

Para servir los contenidos en formato streaming se ha empleado el Darwin
Streaming Server (DSS). El DSS es un servidor de video que soporta los
diferentes formatos utilizados en los servicios de video sobre terminales móviles
como MPEG4, H.263, H.261. El servidor era el encargado de trocear el contenido
y encapsularlo en RTP siguiendo el formato especificado del RFC 3640. En el otro
extremo se ha utilizado el cliente de streaming QuickTime, cuyas funcionalidades
rescindían la negociación inicial del vídeo y la representación por pantalla del
contenido del vídeo.

A continuación el tráfico es conducido hacia un emulador de UMTS donde se
intercepta el tráfico correspondiente a una comunicación y se aplica, a cada
paquete, las condiciones de contorno que debe experimenta un usuario si
estuviese realizando dicho servicio sobre UMTS, Para dichas simulaciones la
configuración del escenario implementa diferentes RABs para servir el vídeo. El
emulador de UMTS ha estado desarrollado en el proyecto IST ARROWS
enmarcado en un proyecto de innovación para sistemas de comunicaciones
móviles de 3ª generación, teniendo como objetivo proporcionar datos del
comportamiento del sistema UMTS delante de implementaciones de algoritmos
para la gestión de recursos radio (RRM). El emulador tiene la capacidad de
simular escenario UMTS con un número determinado de usuarios, cada uno de
ellos con unas características definidas. Destacar que el proyecto IST ARROWS
ha sido financiado por la UE ¡Error! No se encuentra el origen de la referencia.

Una vez el trafico ha travesado el simulador UMTS el cliente de streaming recibe
el flujo y empieza el proceso de decodificación del video influido por las perdidas
de paquetes y retardos experimentadas durante la transmisión y el procesado en
el simulador. Finalmente para valorar la calidad observada por el usuarios, se han
realizado capturas del video que presentado por el cliente de streaming, para
pasarlo posteriormente a una herramienta de valoración de calida.
2 RFC titulado “RTP Payload Format for Transport of MPEG-4
Elementary Streams”

El software encargado de la valoración de la calidad es una implementación de los
modelos de percepción de la calidad definidos por las recomendaciones de la
ITU-T [5][6], el nombre del cual es Video Quality Metrics (VQM) [7]. VQM
implementa diferentes algoritmos que estiman la calidad en comparar dos vídeos
obteniendo diferentes parámetros como PSNR o valor de MOS (Mean Opinión
Store) de dicha comparación.


Ilustración 2 – Escenario de pruebas.

Mediante la combinación de todos los elementos anteriormente citados
procedemos al estudio del efecto de filtro avanzado de contenidos y su efecto en
el sistema UMTS. Una de las opciones para diferenciar el tipo de imagen que
trasporta el paquete RTP implementada por el DSS, es la negociación mediante
RTSP de meta información transportada en el payload de cada paquete RTP.
Fijando como objetivo diferenciar el tipo de frame que viaja en el payload de RTP
nos centramos en el campo “Frame Type” el cual puede coger los siguientes
valores, con lo que puede permitir diferenciar los frames de forma sencilla:

  • 0 representa un frame desconocido.
  • 1 representa un key frame o frame tipo I.
  • 2 representa un frame tipo B
  • 3 representa un frame tipo P.

Una vez evaluada la alternativa se ha descartado por no obtener un resultado
positivo en la configuración del escenario, solucionándolo la problemática
mediante la implementación una aplicación específica cuya funcionalidad era
clasificar en función del contenido del paquete RTP. La implementación del filtraje
se basa en la captura de los paquetes de streaming, los cuales están
encapsulados mediante el RFC3 3640.

Recorriendo el payload del paquete RTP y con la ayuda de las secuencias definidas
en MPEG4 podemos identificar el tipo de información y redireccionarla
adecuadamente. A modo de resultados provisionales a continuación se
proporcionan resultados que demuestran la validez del esquema propuesto.
Concretamente, y como paso previo a la configuración de los servicios portadores
sobre el emulador de UMTS, se estudio la sensibilidad en términos de pérdidas de
paquetes que presentan las diferentes componentes del video MPEG4. Para ello
se realizo un montaje del filtro comentado al que se añadió además funciones de
gestión de colas de cara a forzar unas determinadas tasas de pérdidas en
cada componente. En la ilustración 3 se muestra de forma esquemática dicho
montaje.


Ilustración 3- Esquema del filtraje propuesto.

Partiendo de esta implementación se ha configurado un escenario donde la tasa
de pérdidas en las colas por donde se envían las tramas I es diferente del resto de
información donde se encuentran por ejemplo las tramas P. Con este escenario
definido se ha realizado la valoración de la calidad observada mediante software
especializado siguiendo las recomendaciones de la ITU y se han obtenido los
resultados mostrados en la siguiente figura.


En el eje horizontal de la gráfica siguiente tenemos situada la variable de perdidas en
formato porcentual exceptuando el canal por el que se transmiten los frames del
tipo I. Con todo ello encontramos una disminución de la calidad observada a
medida que aumentan las pérdidas en el canal, comportamiento esperado que se
verifica en entornos reales. En el caso que se protejan las imágenes tipo I,
transmitiéndolas por un canal mejor, encontramos que la calidad MOS aumenta
considerablemente para valores de pérdidas de paquetes altos (15-20%), con una
mejora considerable en el funcionamiento de servicio de video streaming.
Destacar que la información transmitida por el canal de frames tipo I representa
porcentajes bajos respecto la información transmitida por canales destinados a la
transmisión de frames tipo P u otras topologías. Si se aplican porcentajes de
perdidas con valores aproximados de un 5% se observa una disminución de la
calidad respecto a canales con 0% de perdidas para frames tipo I, pero a su vez
una mejora respecto canales donde no se hace ningún tipo de distinción.

Concluyendo el resumen y después de las experiencias realizadas pasamos a
trasladar estas experiencias para entornos como UMTS donde la implementación
de los diferentes canales mediante la configuración de diferentes RABs para un
mismo servicio, puede tener diferentes consecuencias a nivel de sistema,
analizadas en el articulo completo.

1 comentario: