[go: up one dir, main page]

0% encontró este documento útil (0 votos)
80 vistas78 páginas

Tecno Completo

Este documento describe diferentes tipos de sensores de imagen como CCD y CMOS, y cómo estos convierten la luz en señales eléctricas. También explica cómo se generan las señales de luminancia (Y) y crominancia (R-Y, B-Y) a partir de las señales de color RGB. Por último, detalla diversos instrumentos como waveform, vectorscopio y histogramas que se usan para analizar las señales de video.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
80 vistas78 páginas

Tecno Completo

Este documento describe diferentes tipos de sensores de imagen como CCD y CMOS, y cómo estos convierten la luz en señales eléctricas. También explica cómo se generan las señales de luminancia (Y) y crominancia (R-Y, B-Y) a partir de las señales de color RGB. Por último, detalla diversos instrumentos como waveform, vectorscopio y histogramas que se usan para analizar las señales de video.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 78

Mormor

www.wuolah.com/student/Mormor

1187

Tecnología.pdf
Tecnología (Tema 1 y 2)

2º Cinema, àudio i vídeo digitals

Grado en Cine y Medios Audiovisuales

Escuela Superior de Cine y Audiovisuales de Cataluña


UB - Universidad de Barcelona

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Tecnología

0. Repaso CCD

Los sensores reciben luz (fotones) y generan voltaje eléctrico. Tipos de sensores. FT / IT / FIT
Aunque los principales son dos, que conviven:
CMos.
1) CCD - Capta tres señales (RGB) y las analiza por separado. 3 sensores
cada uno para un color. Una cámara de 3 CCDs requiere cierto tamaño, pero
es más robusta, y que hay menos posibilidades de aberraciones provocadas
por golpes, por ejemplo.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2) Filtro Bayer - Dentro del filtro hay pequeños microsensores.
La resolución cromática es peor en el filtro Bayer, porque tiene menos
información de cada componente. Esta cámara ahorra más espacio
que la de 3 CCDs, pero al tenerlo todo en un mismo sitio, puede dar
aberraciones con más facilidad si recibe un golpe, por ejemplo.

Al final, de los sensores (sea el que sea) salen tres señales RGB. Se pueden tratar por separado
(más calidad, más ancho de banda) o haciendo combinaciones lineales (menos calidad, menos
ancho de banda) para ahorrar. R-Y 8 (v)

Así se hace la Y (luminancia) [Y = 30% R + 59% G + 11% B] Así se hace el color B-Y (v)

Es el que tiene más información por lo que da más margen de G = Y - (R+B)


maniobra si hay errores de compresión.

El sistema en componentes es la base de las señales profesionales, la mayoría de sistemas


trabajan a partir de esta señal nativa. [Sistema en componentes = Y, R - Y, B - Y]
A casa nos llega una señal más sencilla, el video compuesto, la suma de Y + C.

Otro tipo de señal es el Separated-Video o S-Video o Y/C [Y/C C = (R - Y) + (B - Y)]


+ Calidad
1. RGB 3 conectores

2. Y, R-y, B-Y 3 conectores

3. Y/C 2 conectores

4. Video compuesto 1 conector


- Calidad
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

En las cámaras profesionales, comprobamos la imagen con SCOPES, aunque se suele usar un
monitor bien calibrado para evitar confusiones.

WAVEFORM

También conocido como monitor forma de onda, lo usamos para ver la


luz y sus tonalidades, y para ver la tendencia lumínica de la imagen.
Hay tantas líneas en el gráfico como definición hay en la televisión, son
tantas líneas como filas tenga la resolución de la imagen.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
VECTORSCOPIO

Mide la componente de color en una imagen, mide la saturación y el


matiz/tono que tiene una imagen.

HISTOGRAMA

Nos permite valorar la cantidad de luz en


una imagen sin ubicarla en el espacio.
Si cogemos una imagen de 1920 x 1080
forma una tendencia a base de “columnas”.

PARADE

También conocido como RGB waveform, son tres monitores forma de


onda, uno para cada canal de color, así vemos la aportación de cada
una de las componentes de color.
Los filtros ópticos son naranjas o azules para compensar la tendencia
cromática de la luz, que debería ser “neutra” cuando pase por la
cámara.
En posproducción se pueden corregir errores de filtros, cogiendo las
señales y disminuyendo/aumentando lo necesario para hacer balance
de blancos.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

1. Electroacústica:
Podríamos diferenciar la luz y el sonido según:

Fotónica (Fotones que viajan a través del aire e impactan contra elementos)

Luz Energía

Electromagnética (Electricidad en movimiento que genera campos


magnéticos). Ciencia en la que conviven campos eléctricos y magnéticos, estos
son proporcionales (si uno disminuye el otro también) y perpendiculares entre
sí.

Velocidad 300.000.000 m/s

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Medio Se puede transmitir en el vacío.

Frecuencia 550 * 10-9 Hz

Longitud de Onda 300.000.000 m/s

Propagación Transversal (Aquella en la que la dirección de la perturbación del


medio es perpendicular a la dirección de propagación de la energía)

Energía Acústica. Necesita partículas sólidas, líquidas o gaseosas, si hay materia el


sonido se pude transmitir.

Sonido Velocidad 340 m/s

Medio No se puede transmitir en el vacío.

Frecuencia 20 Hz – 20KHz

Longitud de Onda 3,4 m/s

Propagación Longitudinal (Aquella en la que la dirección de la perturbación del


medio es paralela a la dirección de propagación de la energía)

Frecuencia: f Longitud de onda: λ

Las veces que se repite un ciclo en Velocidad entre frecuencia


una unidad de tiempo.

Cuando medimos en segundos,


las unidades son los hercios Hz.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Micrófonos y Altavoces
Cinta – Muy poco comunes en el mercado audiovisual.

Dinámicos

Bobina - (70% del mercado) Económicamente accesibles. Duro,


robusto, resistente, da buena calidad acústica, larga durabilidad,
funciona por si solo (micro + cable).

Tipos

Electret – Son los micros que llevan los móviles, a veces se encuentran
en micros de corbata, aunque no se usan mucho en audiovisual. No
son considerados “calidad profesional”.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Electroestáticos

Condensador - (30% del mercado) De estudio, frágiles, caros, pero dan


la mejor calidad de sonido. Son muy sensibles. Para funcionar
necesitan alimentación externa (alimentación phantom).

Piezoeléctricos – Captan la vibración del suelo, se usan muy poco. (Canchas de


básquet, espectáculos de claqué) Es un material que, estimulado previamente, cuando
lo aprietas, desprende electricidad, según presión más o menos voltaje; por ejemplo,
agujas de tocadiscos. Este tipo de micros requieren de una amplificación eléctrica.

Carbón – Están obsoletos, ya no se encuentran.

Micros dinámicos de Bobina Móvil


En un micrófono tenemos una membrana enganchada a una bobina (un cable de cobre
enrollándose sobre sí mismo) en el momento en el que pasa electricidad (gracias a un
conductor9 por el micro, cuando llega el sonido, la membrana se comprime, empujando la
bobina hacia abajo y es corta líneas de flujo magnético. Eso hace que la corriente circule, lo que
da un voltaje mientras cambia el campo magnético, si corta muchas líneas, el voltaje será muy
grande, si corta pocas, será muy pequeño. Al cambiar el campo, la polaridad se invierte,
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

haciendo que la corriente cambie y la membrana se mueva en dirección contraria. Si el sonido


es grave, las partículas se mueven lentamente, si el sonido es una alta frecuencia, muy rápido.

Esto es un transductor acústico-eléctrico, por lo que el movimiento de la membrana depende


de la presión atmosférica, si gritamos mucho se moverá mucho, por lo que generará más voltaje.
Las membranas más grandes requieren más fuerza para moverse, por lo que será menos
sensible. Un buen micrófono será muy ligero y pequeño, para tener mucha sensibilidad.

La salida normal de un micrófono dinámico de bobina móvil es de 100-200 mV, suficiente


como para tirar 40 metros de cable sin tener problema en calidad de sonido/señal.

Altavoz dinámico de bobina móvil.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Estos constituyen el 95% de altavoces disponibles en el mercado. Los altavoces son
transductores eléctrico-acústicos, funcionan igual que los micrófonos, pero a la inversa.
Mientras los primeros reciben presión acústica, estos la expulsan. Un buen altavoz será grande
y tendrá la fuerza suficiente como para mover la membrana.

La salida normal de un micrófono dinámico de bobina móvil es de 10-30 V, suficiente como para
tirar 40 metros de cable sin tener problema en calidad de sonido/señal.

Ese cambió de voltaje entre el micro y el altavoz se generará en el amplificador, que puede estar
dentro del altavoz (altavoz activo) o fuera del mismo (altavoz pasivo).

Los activos necesitan ir enchufados a la electricidad (220 V), porque el amplificador, sin
alimentación externa, no funciona, por lo que tendríamos cables: uno de alimentación
y otro de audio. Algunos tienen outputs con tal de compartir la misma señal con otros
altavoces (típico en discotecas – torres de altavoces)

Los pasivos solo van conectados al amplificador externo, no puedes conectar un audio
directamente, porque una señal de línea (100 mV - 5 V), no son lo suficientemente
potentes como para mover la membrana. Debe haber un amplificador por cada tipo de
señal.

(AÑADIR DIBUJO ALTAVOZ PORÁTIL) Lo hice, pero no lo encuentro, sorry.

Este tipo de altavoz nos sirve para casa y para uso personal, pero para un profesional no es
suficiente. Un altavoz de alta gama/calidad no será pequeño y fácil de transportar, sino que
será del tamaño que la física acústica necesite, con una membrana tan grande como se
requiera, cables de oro en vez de cobre y pasivos con tal de tener más espacio. Ahora, con las
innovaciones tecnológicas los altavoces activos son cada vez de mayor calidad, pero en las
situaciones de altísima gama aún se usan pasivos.

Micrófonos electroestáticos de Condensador


Un condensador es un componente electrónico, físicamente tienen forma de cilindro, que tiene
un núcleo metálico y una placa metálica separados por un material dieléctrico, o la forma de
una lenteja, que tiene dos placas, una frente a otra, separadas por un material aislante y
cubiertas por una capa protectora.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

De las dos placas metálicas una es fija y la otra es móvil y están separadas por aire, por lo que la
distancia entre ellas es variable. La capacidad de un condensador depende del tamaño de las
placas, de la distancia entre ellas y de la conductividad o capacidad aislante del material
dieléctrico. Funciona como un pequeño almacén de carga eléctrica.

Al cargar placas a 48V, si aplicamos presión externa y la distancia entre placa se modifica,
también se modifica la capacidad y este desprende electricidad, al salir vuelve a equilibrarse, y
que la fuente de alimentación es constante. La señal que sale es audio, por lo que la placa se
mueve según la información que le llegue. Con el poco voltaje que genera la capsula (5 mV), no
se podría conectar directamente a un cable, porque solo se oiría ruido, por eso todos los micros
de condensador tienen amplificador integrado, pero el amplificador también requiere de
alimentación.

Por eso los micros de condensador necesitan alimentación externa (phantom), si se queda sin

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
pilas/batería, no funcionará. Por ese cable pasa el sonido y la electricidad, por eso se le llama
fantasma, porque no se ve. La señal de audio es una pequeña variación alrededor de los 48 V de
la alimentación, señal que acaba siendo de entre 100 mV y 200 mV, por lo que su calidad es igual
que la de los micrófonos dinámicos.

Líneas
En sonido existen líneas balanceadas (o simétricas):

- Funcionan mediante a tres conductores en un mismo cable, uno con 0 voltios y dos con
señal de audio (vivos)

- De los que transportan información de sonido, uno lleva la información invertida 180º

- Al sumar las dos señales, el ruido queda aislado y lo podemos eliminar de la señal
original, por eso es altamente inmune a las interferencias.

- Los conectores canon XLR-3 son balanceados porque tienen 3 conectores, dos vivos.

Y líneas no balanceadas (o asimétricas):

- Funciona mediante a dos conductores en un mismo cable, uno con 0 voltios y otro con
la señal de audio.

- La señal que sale del micro puede tener interferencias, que saldrán amplificadas.

Diagramas Polares
La transformación de energía acústica a eléctrica, en realidad pasa en dos fases: de acústico a
mecánico y de mecánico a eléctrico. Todos los transductores hasta hora pertenecen al primer
grupo, pero los micrófonos también pueden clasificarse según el transductor acústico-mecánico
y ne función de la capsula de micrófonos podemos tener diferentes peculiaridades acústicas.
Dentro de un mismo micrófono se pueden elegir diferentes diagramas polares.

Los diafragmas polares son gráficas que reflejan de donde es capaz de recoger el sonido y con
qué sensibilidad. Definen las características de captación de un micrófono en el espacio.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Omnidirecional: Tiene una sensibilidad o salida igual en todos los ángulos, capta sonidos de
todas las direcciones.

Bidireccional (o forma de ocho): Capta el sonido procedente de delante y detrás del micrófono,
pero no el de los laterales.

Cardioide: Tiene la máxima sensibilidad en su parte frontal y l mínima en la trasera.

Supercardioide: Patrón de captura más estrecho que los cardioides y tienen un gran rechazo de
ruido ambiente, captan un poco de sonido por la parte trasera.

Toma de Sonido Estereofónico

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Con un solo micrófono no podemos hacer estereofonía,
porque solo genera una señal (mono). Para hacer
estéreo, necesitaremos como mínimo dos micrófonos,
pero no hay un máximo. Unas de las mejores
configuraciones para captar sonido estereofónico son:

La configuración AB:

Un micrófono A y un micrófono B situados a una cierta


distancia entre ellos. Cuanto más juntos estén entre
ellos, más cercano al mono.

La configuración MS:

Dos micrófonos dónde las capsulas están una encima de


la otra o muy cerca. Un micrófono es un cardioide y el
otro es bidireccional.

La configuración XY:

Dos micrófonos dónde las capsulas están una encima de


la otra o muy cerca. Ambos micrófonos son cardioides.

La configuración Blumlein:

Dos micrófonos bidireccionales, cruzados no encima del otro, provocando un


solapamiento de patrones. Moviendo los micros, podemos controlar el solapamiento
estereofónico (micros en posición horizontal) o mono (micros en posición vertical)

Mesa de Sonido
Siempre tienen una salida de sonido estéreo, con L y R en un lado, a parte de los canales.

Las mesas tienen varios canales monofónicos, dónde el potenciómetro valora el


panorama(PAN). Si está en la L completamente, saldrá el 100% del sonido por la Izquierda (L), si
está en el centro un 50/50, si está en la R completamente, saldrá el 100% del sonido por la
derecha.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Los canales en estéreo tienen un potenciómetro de balance (BAL) que recibe una señal L y una
señal R. Se podrá potenciar una señal de sonido u otra según convenga, si el potenciómetro está
en el centro, ambas señales se oirán igual, pero si lo giras hacia algún lado, el contrario se oirá
menos en proporción.

Los faders tienen el cero arriba, porque hacen una mezcla sustractiva, quitan sonido.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Analógico vs. Digital
A nivel práctico, es mejor el digital, porque permite almacenar más información en menor
espacio. En cuanto a calidad, el analógico se va a degradar con el tiempo, mientras que el
digital mantendrá su calidad material por mucho tiempo que pase.

Sonido = por los odios desde el altavoz

El receptor audiovisual es analógico

Imagen = por los ojos desde la pantalla

El contenido consumido es en su mayoría de origen analógico. (fotos, video, música, etc.)

Origen Procesado Pantalla

80% Analógico
Digitalización Receptor (Analógico)
20% Digital

Como receptores analógicos que somos, tenemos ciertas limitaciones.

Audio
200p El mínimo volumen que podemos oír es 0 decibelios, el
máximo, 140dz.
Zona de En cuanto a señal (vibración) sería un mínimo de 20Hz y
máximo de 200Hz.
trabajo
En fuerza se traducen a una presión mínima de 20mp (menos
20mp ∫ no oímos) y máxima 200p (más nos revienta el tímpano).

20 Hz 200 Hz
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Imagen
El mínimo de luz que podemos ver es 0 wits (menos no vemos)
10.000
y máximo serían 10.000 wits (más derrite la retina).
Zona de Podemos ver desde los 400 nanómetros hasta los 700, para ver
desde el azul hasta el rojo.
trabajo
Dentro de los límites, la resolución es infinita porque siempre
habrá algo que ampliar.
0

400 700

Pero dentro de estos límites, nuestra capacidad es casi infinita. Haciéndonos receptores casi
perfectos.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Su perfección es nuestro problema, porque eso implica que cualquier valor es válido, lo que
hace imposible separar lo útil (señal buena) de lo que ensucia la señal (ruido). El ruido es algo
inevitable pero que no queremos.

La peculiaridad de lo digital Aunque tenga ruido, se puede recuperar la señal digital a través
de su código binario.

Siempre que haya un procesado, es mejor el digital para deshacerse de ruido, porque el ruido
se genera en el procesado. Si el procesado es tan sencillo que no genera prácticamente ruido,
no vale la pena convertir a digital.

En analógico es posible haber omitido información importante al quitar ruido o que se nos
cuele ruido al intentar mantener el máximo de información. Como hay una infinidad de
posibilidades en cuanto a valores válidos, no podemos diferenciar un valor útil del ruido.

La ventaja de trabajar con una señal digital es que son altamente inmunes al ruido.

Desde el punto de vista físico, ambas señales son iguales, son electrones que pasan por un
cable conductor. En el analógico los electrones cambian de flujo, a veces llegan en una
cantidad a una velocidad, otras a otra. En digital o llegan electrones o no llegan.

Los procesadores tienen circuitos creados a partir de resistencias, condensador, bobinas,


transistores y diodos, todos estos elementos pueden fallar y/o añadir un poco de ruido a
nuestra señal, por lo que cuanto peor calidad, más ruido.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Así cómo en las señales analógicas tenemos elementos físicos dentro de los procesadores, en
las “cajas” de procesado digital no, en estas hay puertas lógicas, componentes electrónicos
del mundo digital. Combinando adecuadamente estas puertas lógicas, podemos crear
cualquier circuito digital, pero a pesar de todo, cada puerta lógica acaba siendo un pequeño
circuito analógico (transistor) que solo comprende dos niveles de voltaje (0;1) y de ella sale
una señal nueva y pura, sin ruido.

Conversor Analógico-Digital o Digital-Analógico:


Dispositivo que existe en todos los aparatos audiovisuales (grabadoras, sensores CCD,
pantallas de ordenador, etc.), transforma una señal analógica en una digital para poder tratar
su información de forma más limpia (sin ruido). Pero, en algún momento, deberemos hacer la

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
conversión al revés, porque nosotros (los usuarios) somos analógicos.

Lo que interesa es tener la etapa de conversión lo antes posible, porque así se corren menos
riesgos y tendremos menos ruido en la señal definitiva, igual que interesa que la etapa de
conversión digital a analógico sea lo más tarde posible. Por eso, con la gran apagada analógica
del 2010, los televisores tuvieron que incluir conversores D/A, para poder leer la Televisión
Digital Terrestre con los conectores analógicos, las televisiones más nuevas ya incluyeron ese
conversor en sí mismas.

Procesado

Analógico Analógico Analógico

Pérdidas Pérdidas
Analógico Digital Analógico
A/D D/A

Pérdidas
Digital
Digital D/A Analógico

Hoy en día, a la práctica, no encontraremos conversores ni tarjetas digitalizadoras, porque las


cámaras y las pantallas ya los tienen integrados. Aun así, lo estudiamos para comprender y
dominar los parámetros con los que trabajamos.

Hay tres etapas en los conversores (da igual el sentido):

- Muestreo:

Consiste en tomar muestras, de una forma constante se analiza una señal y se toman
muestras de esta. Por lo que tenemos es una señal formada por muchos impulsos con
la misma amplitud que la señal original, la Pulse Amplitude Modilation (P.A.M).

Al muestrear, se pierde cierta información, por lo que cuanto más alta la frecuencia de
muestreo, menos información sacrificaremos. Es imposible no perder información,
porque una señal analógica es infinita y la señal digital requiere de un código que no es
infinito, en algún momento el código nos limitará el acceso a información.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Cuanta más muestras tenemos, más información tenemos, más pesan los archivos y
más lento el flujo de trabajo. Por lo que lo ideal es tomar el mínimo de muestras para
tener la calidad de señal que queremos. Siguiendo el teorema de Nyquist, cómo
mínimo la frecuencia de muestreo debe ser el doble de la máxima frecuencia que
queramos digitalizar. Las frecuencias de muestreo estándar en el sonido son:

44.100 > 48.000 > 96.000 > 192.000

En el video cada muestra es un pixel, por lo que la frecuencia de muestreo dictamina la


cantidad de pixel en la imagen, cuanto mayor frecuencia, mejor.

720 x 576 Standard Definition (SD)

1440 x 1080 High Definition (HD) 1920 x 1080 High Definition (HD)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3840 x 2160 Ultra High Definition (UHD)

Debemos trabajar en la calidad que vayamos a consumir (hay que dimensionar), no


vamos a hacer un video a 4K si vamos a verlo en un teléfono cuya resolución máxima es
1440 x 1080.

Todo esto teniendo en cuenta que el tamaño del pixel sea cuadrado, es decir, del Aspect
Ratio. Si grabamos una imagen en 4:3 y la proyección es en 16:9, el pixel se estiraría
(pixel anamórfico).

Cuando trabajamos con sonido, más muestreo implica más armónicos, es decir, más
sensibilidad a las altas frecuencias. Una alta resolución en sonido exige detalle.

Normalmente, en las cámaras de video muestrean las tres señales de R (Y), G (R-Y) y B
(B-Y) en paralelo, o que implica que teóricamente debería haber la misma frecuencia de
muestreo para las 3 señales digitales, pero no suele ser así. Las señales de color [(R-Y) +
(B-Y)] suelen tener una frecuencia de muestreo igual entre ellas, pero distinta a la señal
de luminancia (Y). En esos casos, aparecen subnormas de muestreo.

4:4:4 Todos los pixeles tienen luz y todos tienen color

4:2:2 Todos los pixeles tienen luz, pero tenemos la mitad del color.

4:1:1 Todos los pixeles tienen luz, pero tenemos un cuarto del color.

4:2:0 Todos los pixeles tienen luz, pero tenemos un cuarto de color y algunas filas sin.

En función del muestreo se determinará el ancho de banda, el tamaño del pixel, el


tamaño de la pantalla, la distancia a la cual la vemos, etc.

- Cuantificación:

La cuantificación y la codificación van unidas, un proceso implica el otro, comienza el


“¿Qué hacemos con el ancho de banda?”. Modificaremos la amplitud de la muestra para
adaptarla al nivel de cuantificación más cercano, modificar la realidad implicará añadir
ruido, es igual de grave añadir información que reducir.

Cuando alguien hace un proceso de digitalización y cuantifica, el error máximo que se


puede generar en Q/2, por lo que según el caso será mejor aumentar o reducir la
amplitud.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Muchos sistemas tienen 256 niveles de cuantificación porque nuestro ojo no puede
captar más de 256 tipos de gris. Cuando trabajaos con una imagen con muy pocos
niveles, se provoca el “banding” y la imagen no coge todos los degradados y matices que
la realidad ofrece, faltan colores intermedios/de transición.

2n = cantidad de combinaciones
Al aumentar un bit la cuantificación, se duplica la cantidad de combinaciones de 0 y 1
que podemos hacer, por lo que aumentamos la información de grises en la
cuantificación y tendremos más grises entre el negro y el uno.

- Codificación:

La cuantificación y la codificación van unidas, un proceso implica el otro. Una vez


tenemos los niveles y cantidad de combinaciones, transformamos las muestras tomadas

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de la señal analógica en información en código binario, por lo que la convertimos en
señal digital.

0 1 1 0 1 0 0 1 0 0 0 0 1
1v 7

1
0v 0

Tanto en imagen como en sonido, si nos llega un archivo con pocos bits (profundidad de color
en el caso de la imagen) podemos añadirle ruido hasta encontrar el punto en el que nos sea
beneficioso para quitar el banding.

En el caso del sonido, el oído es mucho más sensible al captar impulsos sonoros, por lo que se
requieren muchísimos niveles para poder evaluar todos los rangos sonoros somos más
exigentes acústicamente.

¿Cuál es el ancho de banda de una señal digital?

Hoy en día, el video se rueda a 8 bits (256 niveles de cuantificación) o a 10 bits (1024 niveles),
el sonido, por otro lado, se registra a 16 (15625 niveles) bits o a 24 bits (millones).

Si un sonido estéreo trabaja a 44.100 a 16 bits, trabajará con 750.000 b/s por lado, por lo que
trabajará con 1,49 mb/s. Esa es la capacidad de un compact disc.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266

Ejercicio: ¿Ancho de banda de una señal HDTV a 4:2:2, 8 bits, 25fps?

Y = 1920 x 1080 pixel/frame x8 x25 = 414.720.000 b/s En los televisores de casa no se puede

R-Y = 960 x 1080 pix/f x8 x25 procesar tanta información, entonces


< = 207.360.000 b/s
vemos un ancho de banda de 5Mb/s.
B-Y = 960 x 1080 pix/f x8 x25 = 207.360.000 b/s

(aprox.) 819.000.000 b/s = 819 Mb/s

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4K – (4096 x 2160) 17:9 [Cine] 2K – (2048 x 1080)
UHD – (3840 x 2160) 16:9 [Cine] HD – (1920 x 1080)
Llamamos 4K a lo que realmente es UHD, porque la diferencia es mínima. Por eso se suele
grabar en la mayor resolución posible porque se pierde calidad en el proceso de compresión.

Compresión en otro documento


Mormor
www.wuolah.com/student/Mormor

1302

Compresión.pdf
Compresión

2º Cinema, àudio i vídeo digitals

Grado en Cine y Medios Audiovisuales

Escuela Superior de Cine y Audiovisuales de Cataluña


UB - Universidad de Barcelona

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849

Compresión
En un mensaje hay siempre un componente muy importante que es redundante (redundancia)
y otra que es estrictamente necesaria (entropía). Suele haber una gran cantidad de redundancia
y poca entropía, por lo que podemos reducir peso comprimiendo/eliminando la redundancia.

Redundancia Buenos días, ¿podría traerme un café cuando le vaya bien, por favor?
Entropía

La diferencia entre entropía y redundancia la decide el usuario y, a partir de allí, se


decide un tipo u otro de compresión.
Reversibles/Lossless:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tras haber comprimido un archivo, lo puedes descomprimir y recuperar
su tamaño inicial, aunque no tiene altos factores de compresión.
Estadísticas (VLC, RLC, etc.)
Ejemplo: Archivos RAW

Irreversibles/Lossy:
Los archivos comprimidos pesan menos, pero no se puede volver a
recuperar el peso total original, tiene altos factores de compresión, pero
mucho riesgo de perder información para siempre.
Transformados/ Espaciales (DCT, Wavelets)
Temporal (Estimación y compensación de movimiento.)
Ejemplo: Archivos .jpg

Se suelen combinar, aunque en el 98% de las ocasiones, en video se usan lossy, aunque
se trate de que no tengan una pérdida traumática de información. Combinando estos
tipos de compresión adecuadamente, podemos comprimir prácticamente cualquier
cosa, cada CODEC usa unos u otros.
Las técnicas de compresión estadísticas o entrópicas comprimen información de datos,
1 y 0, representen lo que representen. La probabilidad de aparición y combinación de 1
y 0 nos permitirá deducir técnicas más fáciles de codificación. Siempre son lossless, sin
pérdidas y reversibles.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849

Variable Length Coding (VLC)


Si tuviéramos que codificar una frase en código binario, necesitaríamos un código de 5
bits, porque hay 27 letras en el abecedrio (25 = 32) y a cada letra le damos un código.
Una frase como: El ordenador está apagado.
Tiene un peso de 26 caracteres x 5 bits = 130 bits. Se puede reducir según la probabilidad
de aparición de cada carácter. Las letras que aparecen más a menudo tendrán códigos
cortos, las que aparecen de vez en cuando, tienen códigos más largos.
a (5) = 00 e (3) = 01 o (3) = 10 d (3) = 11 r (2) = 001
l (1) = 010 n (1) = 011 s (1) = 100 t (1) = 110 p (1) = 111 etc.
El código morse es un código VLC, pues se basa en la misma idea solo que en vez de 0 y

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1 tenemos puntos y rallas. El código Huffman también es un código de longitud variable.
Run Length Coding (RLC) 0000 = 0
0001 = 1
00000000001111111110000000000000000001111111111110000000 pesa 70 bits 0010 = 2
0011 = 3
10 “0” 9 “1” 15 “0” 12 “1” 7 “0”
0100 = 4
1010 0 1001 1 1111 0 1110 1 0111 0 pesa 25 bits 0101 = 5
0110 = 6
0111 = 7
1000 = 8
Los sistemas transformados transforman la realidad cambiando de dominio la 1001 = 9
información para comprimir (cargándose las altas frecuencias) y devolverlo al dominio 1010 = 10
original. 1011 = 11
1110 = 12
En el caso del sonido: pasando del dominio amplitud-tiempo al dominio amplitud- 1100 = 13
frecuencia. Tienen señales de mucha amplitud y de muy poca a la vez, porque tenemos 1101 = 14
1111 = 15
las altas y bajas frecuencia en una sola señal.
En el caso de la imagen: panado del domino temporal-espacial al dominio espectral (el
de las frecuencias) para comprimir
“Los sistemas transformados puede analizar un cuadro y saber en que % se ha usado
qué tipo de pincel.”
Discrete Cosine Transform (DCT)
A simple vista no podemos discernir que es comprimible y qué no en una fotografía,
como es imposible podemos recurrir a los sistemas transformados.
Pasamos del dominio del espacio/tiempo al dominio espectral (el dominio de las
frecuencias) a través de un proceso matemático, haciendo la inversa (DCT -1) volvemos
al dominio espacio/temporal. Una vez estamos en el dominio espectral eliminamos
aquella información que no queramos de forma controlada y precisa, para que no afecte
a la información que queremos mantener intacta.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849

Una vez el archivo (foto/sonido) ha vuelto al dominio espacio/tiempo, pesa menos,


porque ha perdido resolución
Los ordenadores que hacen estos procesos deben ser muy potentes, porque tienen
procesados muy pesados, para facilitar ese trabajo, las imágenes, por ejemplo, se
desgranan en bloques más pequeños (8x8 píxels).
De este bloque se hace la Transformada Discreta
del Coseno (DCT), sobre la matriz se distribuyen
los patrones, uno por píxel (en el ejemplo, 8x8=64
patrones). Se distribuyen en el espacio según nivel
de detalle:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esquina superior izquierda = Corriente Continua
o DC, nada de detalle.
Esquina inferior derecha = Corriente Alterna o
AC, máximo detalle.
A partir de cualquier imagen puede decirnos
cuales de estos patrones intervienen en y en qué porcentaje para formarla. Esto se
puede usar tanto para brillo como para color.

Este ejemplo, tendría muy poco detalle, pero aún teniendo una imagen con mucha
entropía, al coger bloques de 8x8 píxels, existe la posibilidad de que la distribución
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849

espectral quede centrada en los coeficientes de baja frecuencia. Esto quiere decir que,
al coger muestras tan pequeñas, el DCT no ve si la imagen en general tiene o no detalle,
sino la cantidad de detalle que tiene una muestra.
La DCT no comprime, sino que analiza la imagen, quien comprime es la matriz de
cuantificación. Los programas de compresión tienen varias matrices distintas según lo
mucho que quieras comprimir (cuando guardamos un .jpg en Photoshop en alta o baja
calidad, son matrices distintas), dividiendo el bloque analizado por la DCT por la matriz
de cuantificación, conseguimos un bloque con un menor peso porque tiene menos
detalle.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esto pesa 512 bits

Esto pesa 72 bits


Digitalització del Senyal de Vídeo

! Processos en la digitalització d un senyal

Senyal
Senyal digital
analògic
FPB MOSTREJADOR QUANTIFICADOR CODIFICADOR
x(t)

x(t) de banda xm(t) b bits. 2b nivells


limitada a Fmax b=8 , 256 nivells
b=10, 1024 nivells
Fm Criteri de Nyquist:

Fm > 2 Fmax

@Xavier Bonet 1
Senyal de vídeo analògic

Camp I Camp II

.... Camp I Camp II Camp I Camp II Camp I Camp II ....

1/50 s ≡ 20ms
@Xavier Bonet 2
1/25s ≡ 40ms
Mostratge Ortogonal

!  Per tal d obtenir un patró de mostratge ortogonal, cal


que la freqüència de mostratge sigui un múltiple
enter de la freqüència de línia.

Línia 1

Línia 2

Línia 3

Línia 625

@Xavier Bonet 3
Senyal Digital en Components
(ITU-R601)

Y
retard 5.5Mhz A/D Y

Senyals (B-Y) 0.49


CÀMERA primaris 2.75Mhz A/D U
(B-Y)
corregits
en Gamma.
(R-Y) 0.88 2.75Mhz A/D V
(R-Y)

8 bits
Paral·lel
U, V: 432 mostres per línia Mostratge Mostratge a
360 en part activa 6.75 Ms/s 13.5 Ms/s
Y: 864 mostres per línia (64us)
720 en part activa (53.3us).

@Xavier Bonet 4
Assignació de mostres

@Xavier Bonet 5
Assignació de mostres

!  Nivells de quantificació de Y !  Nivells de quantificació de U i V

@Xavier Bonet 6
Patrons de Mostratge d Imatge

4: 2: 2 4:1:1 4:2:0
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx

X: component de Y
: components de U i V
@Xavier Bonet 7
Mostres Actives a cada Sistema

858 pixels (63.556 µs) 864 pixels (64 µs)

525 línies 625 línies


Àrea Activa Àrea Activa
480 línies 576 línies

720 pixels (53.3 µs) 720 pixels (53.3 µs)


Sistema de 525 línies Sistema de 625 línies

!  Per raons de compatibilitat, tots dos sistemes tenen el mateix


nombre de mostres per línia (720).
@Xavier Bonet 8
Formats Comuns de Vídeo Digital
necessitat de compressió

Format d’Imatge Ressolució Im./Seg. YCrCb Escombrat Velocitat


(Mbps)
CCIR-601 (NTSC) 720x480 30 4:2:2 Entrellaçat 166.9

CCIR-601 (PAL) 720X576 25 4:2:2 Entrellaçat 165.6

SIF (NTSC) 352X240 30 4:2:0 Progressiu 30.4

SIF (PAL) 352X288 25 4:2:0 Progressiu 30.4

CIF 352X288 30 4:2:0 Progressiu 36.5

QCIF 176X144 30 4:2:0 Progressiu 9.125

Cal comprimir
@Xavier Bonet la informació! 9
Compressió de vídeo

!  Conceptes de redundància i entropia


!  Introducció a la compressió
- Espaial
- Estadística
- Temporal
!  Mètodes de compressió predictius.
- DPCM
- ADPCM
!  Mètodes de compressió estadístics.
- VLC
- RLC
!  Mètodes de compressió transformats
- DCT

@Xavier Bonet 10
Necessitat de la Compressió

!  L ample de banda disponible és limitat


!  Fins i tot en el cas de disposar d ample de banda infinit,
l accés a aquest té un cost no nul
!  La compressió de vídeo digital permet trobar el punt de
compromís òptim entre la qualitat d imatge requerida
per una aplicació específica i l ample de banda ocupat.

@Xavier Bonet 11
Redundància i entropia

!  S'entén per redundància aquella part de la informació,


necessària per a “cuidar” o completar la forma d un
missatge, la qual no és estrictament necessària, però
ajuda a la comprensió del mateix.

!  S'entén per a entropia aquella part de la informació,


vital per a la comprensió completa d un missatge.

@Xavier Bonet 12
Exemple d imatges amb elevada redundància

@Xavier Bonet 13
Exemple d imatges amb elevada entropia

@Xavier Bonet 14
Fonaments de la compressió

!  La raó per la qual podem comprimir informació és


perquè les fonts d informació típiques amb què ens
trobem habitualment contenen grans dosis de
redundància.

!  Les tècniques de compressió s encarreguen d eliminar


aquesta redundància de la informació per tal d obtenir
una representació més compacta.

@Xavier Bonet 15
Tipus de compressió

!  Compressió Reversible (Lossless)


!  Permet recuperar l original de manera exacta després de
descomprimir.

!  Compressió Irreversible (lossy)


!  Permet recuperar una aproximació de l original, amb un grau de
qualitat inversament proporcional al factor de compressió

@Xavier Bonet 16
Fonaments de la compressió de vídeo

!  El vídeo es pot entendre com una successió d imatges


estàtiques.
!  Podem trobar 3 tipus de redundàncies en el vídeo:
!  espaial
!  temporal
!  estadística
!  A més si considerem les limitacions del sistema visual
humà podem comprimir més (redundància psicovisual).

@Xavier Bonet 17
Eliminació de la redundància espaial

!  Un píxel pot ser deduït a partir dels seus píxels propers.


!  Existeixen dos tipus de compressió espaial:

!  - Intracamp: Compressió aplicada a partir de píxels propers de


un mateix camp.

!  - Intracuadre: Compressió aplicada a partir de píxels propers de


un mateix fotograma.

@Xavier Bonet 18
Eliminació de la redundància estadística

!  La compressió estadística són tot aquell conjunt de


tècniques que a partir de l anàlisi de la probabilitat
d aparició d un ítem, aconsegueixen minimitzar-ne el
seu tamany, sovint sense perdre n informació.

!  Els compressors estadístics es poden considerar


reversibles (lossless).

!  El VLC i el RLC són els compressors estadístics


majoritàriament utilitzats.

@Xavier Bonet 19
Eliminació redundància temporal

!  Una forma senzilla:


!  enviar la primera imatge
!  enviar la diferència entre la primera i la segona (menys costós)
!  Problema:
!  en cas de moviment la diferencia a enviar pot ser molt gran
!  Solució:
!  1.Estimació de moviment
!  2.Compensació de moviment

@Xavier Bonet 20
Estimació i compensació de moviment

!  1. Estimació de moviment: deducció del moviment de


cada bloc de la imatge

Imatge n-1 Imatge n

!  2. Compensació del moviment: s aplica el moviment deduït en la


fase anterior a la imatge de referencia per fer una millor predicció.

predicció Imatge
@Xavier Bonet n 21
Mètodes de compresió predictius

!  DPCM (Diferential Pulse Code Modulation) : El sistema


DPCM enlloc de codificar tota la amplitud d una mostra tan sols
codifica la diferencia entre mostres consecutives.
!  Habitualment per a realitzar aquest procés s utilitza un circuit
predictor, de manera que no es codificarà la diferencia entre mostres
consecutives, sinó la diferencia entre la predicció de una mostra i el
valor real de la mostra.

Codificador DPCM Decodificador DPCM

@Xavier Bonet 22
Mètodes de compressió predictius

!  ADPCM (Adaptative Diferential Pulse Code Modulation):


El sistema ADPCM funciona bàsicament de la mateixa manera que el
DPCM però enlloc de realitzar la predicció a partir d una mostra, fa la
predicció a partir de diverses mostres. Això implica un augment de la
complexitat del circuit de predicció però s'aconsegueix un millor factor
de compressió.

@Xavier Bonet 23
Mètodes de compressió predictius

!  Aquests mètodes es poden extrapolar al treball amb


imatges de forma que a partir de una o diverses
imatges es realitzi una predicció i es codifiqui la
diferencia entre la imatge real i la predicció de la
mateixa.

!  - Intercamp: Compressió aplicada a partir de la predicció entre


camps propers.
! 
!  - Intercuadre: Compressió aplicada a partir de la predicció entre
imatges properes.

@Xavier Bonet 24
Mètodes de compressió estadístics

!  VLC (Variable Length Coding): Assigna codis molt curts a


aquells paràmetres mes repetitius i codis mes llargs a aquells
paràmetres menys repetitius.

Probabilitat %

Alfabet
AEIOBS..........XKW

Codis curts Codis llargs

@Xavier Bonet 25
Mètodes de compresió estadístics

!  RLC (Run Length Coding): Els sistemes RLC consisteixen en


codificar el número de vegades que apareix una mostra enlloc de
codificar moltes de seguides del mateix valor. Així enlloc de codificar
1,1,1,1,1,1,1,1,1,1 es codifica 10 uns

@Xavier Bonet 26
Mètodes de compressió transformats

!  Els sistemes de compressió transformats es basen en


l anàlisi espectral d un senyal.
Patró de la DCT

@Xavier Bonet 27
Transformada Discreta del Cosinus (DCT)

!  Efectua un canvi de base per obtenir una nova


representació d un senyal digital
!  El senyal transformat es caracteritza per:
!  (a) L energia es troba concentrada en un nombre petit
de coeficients espectrals (bàsicament en aquells
corresponents a la baixa freqüència)
!  (b) Els coeficients espectrals estan decorrelats entre ells
!  La imatge es divideix en blocs de tamany 8x8 píxels i la
transformació s aplica a cada bloc per separat

@Xavier Bonet 28
Transformada Discreta del Cosinus (DCT)

@Xavier Bonet 29
Exemples de la DCT 2-D (8x8)

@Xavier Bonet 30
Ordre de Codificació dels Coeficients

!  Després de ser quantificats, els coeficients transformats


són codificats seguint el camí d energia decreixent
!  L escombrat resultant té la forma zig-zag:

@Xavier Bonet 31
Exemple

Bloc original 8x8 Bloc Transformat

Matriu de quantificació Bloc quantificat

@Xavier Bonet 32
Wavelets

!  Degut a que les components d alta freqüència en imatges naturals


habitualment són pràcticament nuls, les subimatges LH, HL, HH
pràcticament no contenen informació, la qual cosa permet centrar la
majoria de bits de la codificació en la subimatge LL. De manera que es
pot aconseguir una compressió eficaç al emmagatzemar les 4 imatges
enlloc de la imatge original.

@Xavier Bonet 33
Wavelets

@Xavier Bonet 34
Wavelets

@Xavier Bonet 35
Wavelets

!  La avantatge de la codificació multinivell és que el descodificador pot


descodificar fins al punt en el que tingui suficient resolució, ja que es
tracta de un sistema escalable. Per tant descodificador pot escollir quines
parts descodifica i amb quin nivell de precisió ho fa en diferents regions
de la imatge. Podent arribar a tenir parts de la imatge de sense cap
pèrdua i altres parts de menys interès per a l usuari amb més pèrdues.

@Xavier Bonet 36
Wavelets

!  La transformada wavelet pot treballar amb o sense pèrdues.


!  Les tres imatges de alta freqüència es poden comprimir de forma molt eficient
utilitzant codis VLC i RLC ja que sovint tenen valors molt propers a zero.

!  Es podria considerar que la compressió de la imatge consisteix en enviar primer al


descodificador la part de baixa freqüència LL i posteriorment s afegeix detall a la
imatge amb els contorns que afegeixen les components d alta freqüència LH, HL,
HH . Tenint en compte que la visió humana té molta sensibilitat del detall i poca a
la dinàmica dels contorns, al requantificar la component LL s assignen molts més
bits que en la codificació dels contorns que codifiquen LH, HL, HH .

!  El tamany de cada un dels mosaics són definits per la propia aplicació de codificació
o per l usuari, i s admet que tota la imatge estigui codificada com un tot. Els
resultats milloren quan la subimatge augmenta. A mesura que augmenta la
quantitat de subimatges en les que es realitza la descomposició, apareixen errors
de reconstrucció en els límits de les imatges. Degut a que habitualment la
transformada s aplica en una àrea gran de la imatge, es minimitza l efecte de
blocking que genera la DCT.

@Xavier Bonet 37
Circuit d estimació i compensació
de moviment

00110010111
+
DCT Q VLC
-
Q-1

Memòria DCT-1
+ +
Estimació

Memòria
moviment Compensació
moviment

Vectors
moviment

@Xavier Bonet 38
TECNOLOGIA AUDIOVISUAL
Analògic versus digital
Amplitud!
Màxim!
Un senyal analògic és continu en el
temps i la seva amplitud té una resolució
infinita. Pertant dins de les seves cotes Resolució ∞!
és un senyal perfecte.!

Mínim! Temps!

Temps continu!

Quan un senyal analògic és processat


acostuma a quedar “contaminat” de
soroll. Un soroll que serà pràcticament !
Senyal d’origen, de
bona qualitat.
Senyal processat,
!
amb soroll afegit.

impossible d’aïllar de nou del senyal


original.!
Circuiteria de processat!

ESCAC @ Xavier Bonet 1


TECNOLOGIA AUDIOVISUAL
Analògic versus digital

Degut a que un senyal digital només té dos estats de polarització, quan es troba
“contaminat” de soroll és molt senzill regenerar-lo.!

Amplitud!
Màxim!
Llindar superior! !
Senyal degradat

Llindar inferior!
Mínim! Temps!

Senyal reconstruit !

ESCAC @ Xavier Bonet 2


TECNOLOGIA AUDIOVISUAL
Procés de digitalització genèric

Senyal
analògic
FPB MOSTREJADOR QUANTIFICADOR CODIFICADOR Senyal
digital
x(t)

x(t) de banda xm(t) b bits. 2b nivells


limitada a Fmax b=8 , 256 nivells
Fm b=10, 1024 nivells
b=12, 4096 nivells

Criteri de Nyquist: Fm > 2 Fmax

ESCAC @ Xavier Bonet 3


TECNOLOGIA AUDIOVISUAL
Teorema de mostreig de Nyquist i Shannon

El procés de mostreig, consisteix en avaluar de forma periòdica la amplitud del senyal que s'està digitalitzant. !
!
Un dels requisits que s’ha de contemplar al digitalitzar un senyal és el criteri de Nyquist. De no ser així no es pot
garantir un mínim de qualitat en la digitalització del senyal. A part que molt probablement es podria generar aliasing. !

Amplitud! !
PAM: Pulse Amplitude Modulation.

Màxim!

Mínim! Temps!

ESCAC @ Xavier Bonet 4


TECNOLOGIA AUDIOVISUAL
Teorema de mostreig de Nyquist i Shannon

Sovint, tot i complir el criteri de Nyquist algunes components de molt alta freqüència poden generar
aliasing a baixa freqüència, és per aquesta raó que en la digitalització sempre s’utilitza un filtre anti-
aliasing abans del procés de mostreig. D’aquesta forma s’evita que cap component d’alta freqüència
pugui barrejar-se amb cap component del espectre resultant del procés de mostreig.!

A
Filtre anQ aliasing

f
F b F s 2Fs 3Fs

ESCAC @ Xavier Bonet 5


TECNOLOGIA AUDIOVISUAL
QuanQficació i codificació
Al modificar la amplitud de la mostra per adaptar-la al nivell de quantificació mes proper, s’està generant un error en la
quantificació. L’ error màxim que es pot cometre correspon a la meitat de la amplitud del pas de quantificació.!
!
Això implica que al afegir un bit en la codificació, l’error es redueix a la meitat o sigui la relació senyal soroll augmenta
en 3 db’s.!
Nivell 7 - 111

Nivell 6 - 110 Δ
E max =
Nivell 5 - 101
2

Nivell 4 - 100
Δ (n+1) bits, impliquen! S N = +3db' s
Nivell 3 - 101

Nivell 2 - 010

Nivell 1 - 001

Nivell 0 - 000

ESCAC @ Xavier Bonet 6


TECNOLOGIA AUDIOVISUAL
Codificació i senyal de sorQda del conversor A/D

Amplitud!

111!
Seqüència temporal de les mostres codificades
!
110!
!
101!
010.010.100.110.011.011…
!
100!
!
011!
!
010!
!
001!
!
000! Temps!
010!

010!

100!

010!
110!

011!

011!

011!

110!

011!

110!

011!
111!

111!

111!
!

!
!
ESCAC @ Xavier Bonet 7
TECNOLOGIA AUDIOVISUAL
Digitalització d’un senyal d’àudio

Digitalització de un senyal amb qualitat de CD:!


!
•  La freqüència de mostreig és de 44.100 m/s!
•  A cada mostra se li assigna un codi de 16 bits (216= 65.536 nivells de quantificació)!
•  Al tractar-se d’un senyal estèreo!
!
Ample de banda de un CD és de: 44.100 x 16 x 2 = 1.411.200 bits/s o sigui 1,4 Mb/s!
!
•  Observar que habitualment en so s’utilitza com a freqüències de mostreig; 44.1khz, 48khz, 96khz o 192khz. Tots ells compleixen el criteri
de Nyquist ja que la màxima freqüència que és vol digitalitzar en so és de 20khz.!

•  Observar que habitualment la codificació del so és realitza a 16 bits o 24 bits. Això és tradueix en 65.536 i 16.777.216 nivells de
quantificació respectivament. Per tant la dinàmica que s’aconsegueix treballant amb aquests valors és suficient per donar resposta a la
exigent dinàmica de la oïda humana. !
!

ESCAC @ Xavier Bonet 8


TECNOLOGIA AUDIOVISUAL
Mostreig de un senyal de video

Al mostrejar un senyal de vídeo, el que es fa és avaluar de manera


intervàlica la amplitud del senyal cada una de les línies de televisió.
Cada una d’aquestes mostres en imatge rep el nom de píxel.!
!
La freqüència de mostreig estableix la qüantitat de mostres o pixels
que hi haurà en cada línea. Per tant la quantitat de línies i la
freqüència de mostreig defineixen la resolució de una imatge.!
!
És de vital importància dimensionar correctament la resolució de una A!
imatge en funció de la seva aplicació, per tal de evitar sub o sobre
dimensionar-les. !
!
!
!
!
T
!
!
! ESCAC @ Xavier Bonet 9
TECNOLOGIA AUDIOVISUAL
Resolució en funció de la aplicació

De cara a optimitzar recursos és


important no utilitzar resolucions que
estiguin per sobre de la saturació del ull
humà.!
!
La resolució òptima de una imatge
dependrà, de la relació entre el tamany
d’aquesta i de la seva distància de
visionat.!
!
Aquesta relació condicionarà tambè
l’angle que es crea entre l’ull i la imatge.!
!

ESCAC @ Xavier Bonet 10


TECNOLOGIA AUDIOVISUAL

L’angle visual ve determinat per la distància de visionat i la mida de la pantalla. Per a conèixer la
resolució es necessari també conèixer la quantitat de píxels en la direcció vertical i horitzontal.!

16 α = arctan. sin/cos = arctan. 9/16 = 29.35º


a = d sin α = d sin 29.35º = 0,49d
b = d cos α = d cos 29.35º = 0,87d.
a d 9

α
b

ESCAC @ Xavier Bonet 11


TECNOLOGIA AUDIOVISUAL
QuanQtat de pixels en funció del tamany de pantalla i distancia de visionat

La relació entre el número de pixels en una pantalla en funció de la alçada de la imatge


i la distancia de visionat ve donada per:!

1
Nv =
αn

On Nv és la quantitat de píxels de resolució vertical.!


ɑ correspon a l angle mínim discernible per a l ull (en radians).!
n correspon a D/H. (Distancia de visionat partit per l alçada de la imatge)!

ESCAC @ Xavier Bonet 12


TECNOLOGIA AUDIOVISUAL
Resolució verQcal d’una imatge en funció del tamany de pantalla

Per una imatge de Definició Estàndard (SD):!


1
Nv = −4
≈ 550
6 ⋅ 2.91x10

Per una imatge d’ Alta Definició (HD):!


1
Nv = ≈ 1.100
3 ⋅ 2.91x10 −4

Per una imatge de Ultra Alta Definició (UHD):!


1
Nv = −4
≈ 2.150
1, 6 ⋅ 2.91x10

ESCAC @ Xavier Bonet 13


TECNOLOGIA AUDIOVISUAL
Resolucions de video estandaritzades.

OPTIMAL VIEWING
IMAGE SYSTEM! REFERENCE!
DISTANCE!

SDTV (720x576)! 6H! Rec. ITU-R BT. 601!

HDTV (1920x1080)! 3,2H! Rec. ITU-R BT. 709!

UHD-1 (3840x2160)! 1,6H! Rec. ITU-R BT. 1769!

UHD-2 (7680x4320)! 0,8H! Rec. ITU-R BT. 1769!

OpQmal viewing distance in picture height (H)

ESCAC @ Xavier Bonet 14


TECNOLOGIA AUDIOVISUAL
Relació d’aspecte de píxel

Quan la relació d’aspecte de la pantalla és igual a la relació que hi ha


entre la quantitat de píxels horitzontals i verticals de la imatge, es diu
que la relació d’aspecte dels píxels és quadrada. Quan la relació entre
la pantalla i els píxels no és la mateixa es diu que la relació d’aspecte
dels píxels és anamòrfica. !
Píxels amb relació Píxels amb relació
d’aspecte quadrada d’aspecte anamòrfica

1280 1920

Quan una imatge que té una relació d’aspecte diferent


a la de la pantalla, o apareixen franges negres a la
1080

1080
pantalla, o es deforma la geometria de la imatge
mitjançant píxels anamòrfics. !

ESCAC @ Xavier Bonet 15


TECNOLOGIA AUDIOVISUAL
MulQtud de formats amb diverses relacions d’aspecte

By Jedi787plus - hkps://en.wikipedia.org
ESCAC @ Xavier Bonet 16
TECNOLOGIA AUDIOVISUAL
Digitalització de vídeo per aplicacions professionals
Les recomanacions de la ITU especifiquen que un senyal de vídeo per aplicacions professionals s’hauria de
digitalitzar partint de un senyal RGB o en components (Y, R-Y, B-Y).!

R
QuanQficació
Y M o s t r e i g i
MATRIU Codificació

G
QuanQficació
R-Y M o s t r e i g i MulQplexor
Codificació

B
QuanQficació
B-Y M o s t r e i g i
Codificació

Conversor A/D
ESCAC @ Xavier Bonet 17
TECNOLOGIA AUDIOVISUAL
Normes de mostreig
Les normes de mostreig son una representació de la distribució dels píxels de llum i de color en la pantalla.!
!
La quantitat de mostres de Y defineixen la resolució de la imatge, per tant totes les imatges amb una mateixa resolució tenen la mateixa
quantitat de mostres de Y, independentment de la norma utilitzada.!
!
El motiu pel que existeixen normes diferents a la 4:4:4, és degut a la necessitat de reduir el volum d’informació i se sacrifica la croma enlloc de la
luma degut a que la visió humana té menys agudesa visual en el color que en la llum. !
!
Observar que tot i que les normes 4:1:1 i la 4:2:0 tenen una distribució diferent de les mostres de color, la quantitat de mostres en valor absolut
és la mateixa per tant el seu ample de banda també és el mateix.!
!
Norma 4:4:4! Norma 4:2:2 Norma 4:1:1! Norma 4:2:0!

X Mostra de lluminància Y
Mostra de color R-Y i B-Y
ESCAC @ Xavier Bonet 18
TECNOLOGIA AUDIOVISUAL

Existeix una variant!
!

Norma 4:2:0 Norma 4:2:0

Mostra de color R-Y

Mostra de color B-Y

Camp-1
Camp-2

ESCAC @ Xavier Bonet 19


TECNOLOGIA AUDIOVISUAL
Codificació de un senyal de vídeo

La quantitat de bits amb els que es codifiqui el senyal de vídeo determinarà quants nivells de quantificació
s’utilitzaran per representar la amplitud del senyal. Per tant en el cas d’una imatge en blanc i negre (o per la
component Y), quan major sigui la la quantitat de bits, major serà la gama de grisos que es podrà
representar.!

Imatge codificada a 3 bits, Imatge codificada a 8 bits,


Imatge codificada a 1 bit,
té 8 nivells de lluminància (Y). té 256 nivells de lluminància (Y).
Tan sols té dos nivells de
lluminància (Y).

ESCAC @ Xavier Bonet 20

También podría gustarte