servicios de video streaming: Anexo III: Transmisión diferenciada de vídeo MPEG-4 sobre UMTS

Área de interés: Sistemas y Tecnologías de Radiocomunicaciones

Resumen. En este artículo se analiza la sensibilidad de los diferentes tipos de

información que componen un servicio de video streaming MPEG4 (e.g.

descomposición en tramas I y P) y se propone un esquema de transmisión sobre

UMTS basado en la utilización de múltiples servicios portadores (múltiples

contextos PDP) adaptados a los componentes principales de dicho servicio. Dicha

solución permite aumentar considerablemente el número de usuarios de video

streaming en la red frente a la solución habitual de transportar un determinado

servicio a través de un único servicio portador (i.e. contexto PDP) con los

parámetros de QoS adecuados. El estudio se ha realizado con la ayuda de un

emulador de UMTS y herramientas de estimación subjetiva de la calidad de video.

Introducción

El rápido crecimiento de las redes móviles, como 802.11 o las redes celulares,

unido a una gran demanda de servicios audiovisuales por parte de los usuarios,

está impulsando a ofrecer servir contenidos multimedia en cualquier lugar,

momento y adaptándose a los diferentes dispositivos “anytime ,anywhere,

any device”. En este contexto, la red celular de tercera generación UMTS

representa un claro exponente en la provisión de servicios audiovisuales como la

video llamada o la descarga en streaming de vídeos.

Partiendo de los modelos clásicos de capas, como el modelo OSI, las redes de

comunicaciones móviles han tenido que reformar los protocolos de red existentes,

pensados para redes de cableado fijo, para adaptarse a las redes móviles

caracterizadas por altos retardos, perdidas elevadas, limitaciones en

capacidad computacional de los terminales y un largo etcétera que ha concluido

con una arquitectura multicapa poco optimizada en algunas ocasiones. Por otro

lado gran demanda de servicios de audiovisuales esta provocando la aparición de

soluciones (modelos cross-layer) destinadas a mejorar este modelo multicapa,

donde se debe optimizar cada elemento de la cadena para poder ofrecer con

calidad el mayor número de servicios posibles minimizando los recursos de red

necesarios para ofrecer dicho servicio.

Centrándonos en las aplicaciones de vídeo encontramos diferentes servicios como

la videollamada, descarga en streaming de pequeños contenidos multimedia,

video vigilancia y toda una serie de servicios donde intervienen una gran cantidad

de elementos a optimizar. Para optimizar estos servicios de video poseemos dos a

aternativas básicas de trabajo: optimizar el algoritmo de compresión, y optimizar el

transporte de la información durante el transporte por la red, siendo la segunda

alternativa el objeto de estudio del presente estudio.

En el artículo se hace hincapié en los estándares de compresión de vídeo

recomendados por el 3GPP contrastando las recomendaciones con las propuestas

por de los fabricantes de terminales móviles.

También se incluye algunas el análisis de las especificaciones técnicas de algunos

terminales para enmarcar las recomendaciones analizadas. Así pues, partiendo

del formato de la información a servir y con el objetivo de seguir las

recomendaciones se propone un modelo donde se optimiza la prestación de

servicios audiovisuales, maximizando la calidad observada por el usuario,

relacionándolo los recursos de red necesarios para ofrecer dicha calidad,

centrándonos en especial en la tecnología de tercera generación

(UMTS) para terminales móviles.

Servicios Portadores de datos en UMTS

Los servicios portadores de datos ofrecidos por UMTS admiten múltiples

configuraciones (clase de servicio, tasas binarias, etc.) a la hora de establecer

cómo un determinado servicio (e.g. video streaming) puede soportarse en la red.

A modo de ejemplo en la Tabla 1 se ilustran las clases de servicio especificadas

en UMTS junto con los parámetros de QoS más relevantes de cara a habilitar la

provisión de un determinado tipo de servicio.

Tabla 1. Ejemplo de configuraciones típicas de servicios portadores en

UMTS.

Los servicios portadores se gestionan mediante los denominados contextos PDP

(Packet Data Protocol). Un contexto PDP es la información almacenada en los

distintos elementos involucrados en un momento dado en el trayecto de

comunicación asociado a una sesión de datos entre el móvil y la pasarela de la

red UMTS (GGSN). En el establecimiento del contexto PDP se indican los

parámetros de QoS necesarios así como los filtros de tráfico que van a identificar

qué información debe encaminarse a través de dicho contexto.

Un esquema habitual suele ser transportar un determinado servicio únicamente a

través de un servicio portador (e.g. un contexto PDP) con los parámetros de QoS

adecuados. No obstante, no toda la información enviada a través de un único

servicio portador tiene porque tener la misma relevancia a la hora de determinar la

calidad con la que se ofrece el servicio y, por tanto, las características de QoS del

servicio portador deben adaptarse a las restricciones de la información más

sensible dentro del flujo de datos.

Soporte de vídeo en terminales móviles.

Los fabricantes de teléfonos móviles y los proveedores de contenidos han

redactado una serie de normativas a través del 3GPP para definir los formatos de

la información que han de soportar los dispositivos móviles. A continuación

realizamos un breve resumen en formato tabla de los aspectos más importantes a

la hora de codificar audio y video.

Conversational Streaming Interactive Background

Tabla 2. Resumen de códecs soportados.

Analizando la tabla anterior podemos concluir que el códec utilizado y

recomendado por ambas entidades es el H.263 perfil 0. El perfil 0 nos define

unas restricciones en cuanto a las herramientas técnicas a utilizar para la

compresión del video, resumiéndose en las siguientes características.

Perfil muy sencillos y de baja complejidad.
Posibilidad de predicción mediante frames del tipo I y P, únicamente.
No se necesitan buffer para la posible decodificación.

Todos los códecs anteriormente mencionados se basan en el aprovechar modelos

de predicción temporales y espaciales, con lo que finalmente codifican toda la

información utilizando códigos entrópicos, con lo que se reduce el número de bits

necesarios para codificar la información.

Del proceso de codificación se obtienen los flujos elementales “ES”. Si nos

centramos en el ES visual se generan las imágenes intra (I) e inter (P o B). Las

imágenes I son fotogramas de gran longitud que contienen en ellos mismos toda

la información necesaria par decodificarse. Por el contrario los frames tipo P

codifican información diferencial respecto las imágenes I. Estas características

justifican la necesidad de proteger los fotogramas I respecto P.

Esquema propuesto

En el presente trabajo se propone la transmisión de un servicio de streaming de

video MPEG4 sobre varios contextos PDP adaptados a las diferentes

características del contenido transportado. La solución planteada propone

descomponer el video en varios flujos en función de la importancia que represente

el contenido del paquete para la calidad final del vídeo. Una vez conocido el

contenido del paquete mediante un filtraje, cada paquete es transportado por el

contexto PDP que mejor se adapte a sus necesidades.

En la Ilustración 1 se presenta el contenido de un vídeo como una combinación de

audio, imágenes comprimidas e información adicional. También se puede observar

una diferencia entre el tipo de imagen generada, factor que permitirá diferenciar el

tipo de imagen y priorizarla en función de la importancia que representa dicha

imagen para la calidad final del vídeo.

Ilustración 1- Arquitectura propuesta para servicios de video sobre UMTS.

Dicha separación permite acomodar mejor las características de los servicios

portadores a la relevancia de la información transportada. Dicha optimización es

especialmente relevante en la componente del servicio portador ofrecida sobre la

red de acceso radio UTRAN, denominada Radio Access Bearer (RAB), donde

una relajación de las restricciones de QoS necesarias deriva directamente en un

aumento de capacidad.

Montaje experimental y Resultados provisionales

En la Ilustración 2 – Escenario de pruebas se muestra el montaje

experimental utilizado en el presente estudio. A continuación presentamos cada

uno de los componentes, especificando brevemente sus funciones a realizar.

Para servir los contenidos en formato streaming se ha empleado el Darwin

Streaming Server (DSS). El DSS es un servidor de video que soporta los

diferentes formatos utilizados en los servicios de video sobre terminales móviles

como MPEG4, H.263, H.261. El servidor era el encargado de trocear el contenido

y encapsularlo en RTP siguiendo el formato especificado del RFC 3640. En el otro

extremo se ha utilizado el cliente de streaming QuickTime, cuyas funcionalidades

rescindían la negociación inicial del vídeo y la representación por pantalla del

contenido del vídeo.

A continuación el tráfico es conducido hacia un emulador de UMTS donde se

intercepta el tráfico correspondiente a una comunicación y se aplica, a cada

paquete, las condiciones de contorno que debe experimenta un usuario si

estuviese realizando dicho servicio sobre UMTS, Para dichas simulaciones la

configuración del escenario implementa diferentes RABs para servir el vídeo. El

emulador de UMTS ha estado desarrollado en el proyecto IST ARROWS

enmarcado en un proyecto de innovación para sistemas de comunicaciones

móviles de 3ª generación, teniendo como objetivo proporcionar datos del

comportamiento del sistema UMTS delante de implementaciones de algoritmos

para la gestión de recursos radio (RRM). El emulador tiene la capacidad de

simular escenario UMTS con un número determinado de usuarios, cada uno de

ellos con unas características definidas. Destacar que el proyecto IST ARROWS

ha sido financiado por la UE ¡Error! No se encuentra el origen de la referencia.

Una vez el trafico ha travesado el simulador UMTS el cliente de streaming recibe

el flujo y empieza el proceso de decodificación del video influido por las perdidas

de paquetes y retardos experimentadas durante la transmisión y el procesado en

el simulador. Finalmente para valorar la calidad observada por el usuarios, se han

realizado capturas del video que presentado por el cliente de streaming, para

pasarlo posteriormente a una herramienta de valoración de calida.

2 RFC titulado “RTP Payload Format for Transport of MPEG-4

Elementary Streams”

El software encargado de la valoración de la calidad es una implementación de los

modelos de percepción de la calidad definidos por las recomendaciones de la

ITU-T [5][6], el nombre del cual es Video Quality Metrics (VQM) [7]. VQM

implementa diferentes algoritmos que estiman la calidad en comparar dos vídeos

obteniendo diferentes parámetros como PSNR o valor de MOS (Mean Opinión

Store) de dicha comparación.

Ilustración 2 – Escenario de pruebas.

Mediante la combinación de todos los elementos anteriormente citados

procedemos al estudio del efecto de filtro avanzado de contenidos y su efecto en

el sistema UMTS. Una de las opciones para diferenciar el tipo de imagen que

trasporta el paquete RTP implementada por el DSS, es la negociación mediante

RTSP de meta información transportada en el payload de cada paquete RTP.

Fijando como objetivo diferenciar el tipo de frame que viaja en el payload de RTP

nos centramos en el campo “Frame Type” el cual puede coger los siguientes

valores, con lo que puede permitir diferenciar los frames de forma sencilla:

0 representa un frame desconocido.
1 representa un key frame o frame tipo I.
2 representa un frame tipo B
3 representa un frame tipo P.

Una vez evaluada la alternativa se ha descartado por no obtener un resultado

positivo en la configuración del escenario, solucionándolo la problemática

mediante la implementación una aplicación específica cuya funcionalidad era

clasificar en función del contenido del paquete RTP. La implementación del filtraje

se basa en la captura de los paquetes de streaming, los cuales están

encapsulados mediante el RFC3 3640.

Recorriendo el payload del paquete RTP y con la ayuda de las secuencias definidas

en MPEG4 podemos identificar el tipo de información y redireccionarla

adecuadamente. A modo de resultados provisionales a continuación se

proporcionan resultados que demuestran la validez del esquema propuesto.

Concretamente, y como paso previo a la configuración de los servicios portadores

sobre el emulador de UMTS, se estudio la sensibilidad en términos de pérdidas de

paquetes que presentan las diferentes componentes del video MPEG4. Para ello

se realizo un montaje del filtro comentado al que se añadió además funciones de

gestión de colas de cara a forzar unas determinadas tasas de pérdidas en

cada componente. En la ilustración 3 se muestra de forma esquemática dicho

montaje.

Ilustración 3- Esquema del filtraje propuesto.

Partiendo de esta implementación se ha configurado un escenario donde la tasa

de pérdidas en las colas por donde se envían las tramas I es diferente del resto de

información donde se encuentran por ejemplo las tramas P. Con este escenario

definido se ha realizado la valoración de la calidad observada mediante software

especializado siguiendo las recomendaciones de la ITU y se han obtenido los

resultados mostrados en la siguiente figura.

En el eje horizontal de la gráfica siguiente tenemos situada la variable de perdidas en

formato porcentual exceptuando el canal por el que se transmiten los frames del

tipo I. Con todo ello encontramos una disminución de la calidad observada a

medida que aumentan las pérdidas en el canal, comportamiento esperado que se

verifica en entornos reales. En el caso que se protejan las imágenes tipo I,

transmitiéndolas por un canal mejor, encontramos que la calidad MOS aumenta

considerablemente para valores de pérdidas de paquetes altos (15-20%), con una

mejora considerable en el funcionamiento de servicio de video streaming.

Destacar que la información transmitida por el canal de frames tipo I representa

porcentajes bajos respecto la información transmitida por canales destinados a la

transmisión de frames tipo P u otras topologías. Si se aplican porcentajes de

perdidas con valores aproximados de un 5% se observa una disminución de la

calidad respecto a canales con 0% de perdidas para frames tipo I, pero a su vez

una mejora respecto canales donde no se hace ningún tipo de distinción.

Concluyendo el resumen y después de las experiencias realizadas pasamos a

trasladar estas experiencias para entornos como UMTS donde la implementación

de los diferentes canales mediante la configuración de diferentes RABs para un

mismo servicio, puede tener diferentes consecuencias a nivel de sistema,

analizadas en el articulo completo.

servicios de video streaming

viernes, 4 de febrero de 2011

Anexo III: Transmisión diferenciada de vídeo MPEG-4 sobre UMTS

1 comentario:

Seguidores

Archivo del blog

Datos personales