Tecno Completo
Tecno Completo
www.wuolah.com/student/Mormor
1187
Tecnología.pdf
Tecnología (Tema 1 y 2)
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266
Tecnología
0. Repaso CCD
Los sensores reciben luz (fotones) y generan voltaje eléctrico. Tipos de sensores. FT / IT / FIT
Aunque los principales son dos, que conviven:
CMos.
1) CCD - Capta tres señales (RGB) y las analiza por separado. 3 sensores
cada uno para un color. Una cámara de 3 CCDs requiere cierto tamaño, pero
es más robusta, y que hay menos posibilidades de aberraciones provocadas
por golpes, por ejemplo.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2) Filtro Bayer - Dentro del filtro hay pequeños microsensores.
La resolución cromática es peor en el filtro Bayer, porque tiene menos
información de cada componente. Esta cámara ahorra más espacio
que la de 3 CCDs, pero al tenerlo todo en un mismo sitio, puede dar
aberraciones con más facilidad si recibe un golpe, por ejemplo.
Al final, de los sensores (sea el que sea) salen tres señales RGB. Se pueden tratar por separado
(más calidad, más ancho de banda) o haciendo combinaciones lineales (menos calidad, menos
ancho de banda) para ahorrar. R-Y 8 (v)
Así se hace la Y (luminancia) [Y = 30% R + 59% G + 11% B] Así se hace el color B-Y (v)
3. Y/C 2 conectores
En las cámaras profesionales, comprobamos la imagen con SCOPES, aunque se suele usar un
monitor bien calibrado para evitar confusiones.
WAVEFORM
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
VECTORSCOPIO
HISTOGRAMA
PARADE
1. Electroacústica:
Podríamos diferenciar la luz y el sonido según:
Fotónica (Fotones que viajan a través del aire e impactan contra elementos)
Luz Energía
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Medio Se puede transmitir en el vacío.
Frecuencia 20 Hz – 20KHz
Micrófonos y Altavoces
Cinta – Muy poco comunes en el mercado audiovisual.
Dinámicos
Tipos
Electret – Son los micros que llevan los móviles, a veces se encuentran
en micros de corbata, aunque no se usan mucho en audiovisual. No
son considerados “calidad profesional”.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Electroestáticos
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Estos constituyen el 95% de altavoces disponibles en el mercado. Los altavoces son
transductores eléctrico-acústicos, funcionan igual que los micrófonos, pero a la inversa.
Mientras los primeros reciben presión acústica, estos la expulsan. Un buen altavoz será grande
y tendrá la fuerza suficiente como para mover la membrana.
La salida normal de un micrófono dinámico de bobina móvil es de 10-30 V, suficiente como para
tirar 40 metros de cable sin tener problema en calidad de sonido/señal.
Ese cambió de voltaje entre el micro y el altavoz se generará en el amplificador, que puede estar
dentro del altavoz (altavoz activo) o fuera del mismo (altavoz pasivo).
Los activos necesitan ir enchufados a la electricidad (220 V), porque el amplificador, sin
alimentación externa, no funciona, por lo que tendríamos cables: uno de alimentación
y otro de audio. Algunos tienen outputs con tal de compartir la misma señal con otros
altavoces (típico en discotecas – torres de altavoces)
Los pasivos solo van conectados al amplificador externo, no puedes conectar un audio
directamente, porque una señal de línea (100 mV - 5 V), no son lo suficientemente
potentes como para mover la membrana. Debe haber un amplificador por cada tipo de
señal.
Este tipo de altavoz nos sirve para casa y para uso personal, pero para un profesional no es
suficiente. Un altavoz de alta gama/calidad no será pequeño y fácil de transportar, sino que
será del tamaño que la física acústica necesite, con una membrana tan grande como se
requiera, cables de oro en vez de cobre y pasivos con tal de tener más espacio. Ahora, con las
innovaciones tecnológicas los altavoces activos son cada vez de mayor calidad, pero en las
situaciones de altísima gama aún se usan pasivos.
De las dos placas metálicas una es fija y la otra es móvil y están separadas por aire, por lo que la
distancia entre ellas es variable. La capacidad de un condensador depende del tamaño de las
placas, de la distancia entre ellas y de la conductividad o capacidad aislante del material
dieléctrico. Funciona como un pequeño almacén de carga eléctrica.
Al cargar placas a 48V, si aplicamos presión externa y la distancia entre placa se modifica,
también se modifica la capacidad y este desprende electricidad, al salir vuelve a equilibrarse, y
que la fuente de alimentación es constante. La señal que sale es audio, por lo que la placa se
mueve según la información que le llegue. Con el poco voltaje que genera la capsula (5 mV), no
se podría conectar directamente a un cable, porque solo se oiría ruido, por eso todos los micros
de condensador tienen amplificador integrado, pero el amplificador también requiere de
alimentación.
Por eso los micros de condensador necesitan alimentación externa (phantom), si se queda sin
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
pilas/batería, no funcionará. Por ese cable pasa el sonido y la electricidad, por eso se le llama
fantasma, porque no se ve. La señal de audio es una pequeña variación alrededor de los 48 V de
la alimentación, señal que acaba siendo de entre 100 mV y 200 mV, por lo que su calidad es igual
que la de los micrófonos dinámicos.
Líneas
En sonido existen líneas balanceadas (o simétricas):
- Funcionan mediante a tres conductores en un mismo cable, uno con 0 voltios y dos con
señal de audio (vivos)
- De los que transportan información de sonido, uno lleva la información invertida 180º
- Al sumar las dos señales, el ruido queda aislado y lo podemos eliminar de la señal
original, por eso es altamente inmune a las interferencias.
- Los conectores canon XLR-3 son balanceados porque tienen 3 conectores, dos vivos.
- Funciona mediante a dos conductores en un mismo cable, uno con 0 voltios y otro con
la señal de audio.
- La señal que sale del micro puede tener interferencias, que saldrán amplificadas.
Diagramas Polares
La transformación de energía acústica a eléctrica, en realidad pasa en dos fases: de acústico a
mecánico y de mecánico a eléctrico. Todos los transductores hasta hora pertenecen al primer
grupo, pero los micrófonos también pueden clasificarse según el transductor acústico-mecánico
y ne función de la capsula de micrófonos podemos tener diferentes peculiaridades acústicas.
Dentro de un mismo micrófono se pueden elegir diferentes diagramas polares.
Los diafragmas polares son gráficas que reflejan de donde es capaz de recoger el sonido y con
qué sensibilidad. Definen las características de captación de un micrófono en el espacio.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266
Omnidirecional: Tiene una sensibilidad o salida igual en todos los ángulos, capta sonidos de
todas las direcciones.
Bidireccional (o forma de ocho): Capta el sonido procedente de delante y detrás del micrófono,
pero no el de los laterales.
Supercardioide: Patrón de captura más estrecho que los cardioides y tienen un gran rechazo de
ruido ambiente, captan un poco de sonido por la parte trasera.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Con un solo micrófono no podemos hacer estereofonía,
porque solo genera una señal (mono). Para hacer
estéreo, necesitaremos como mínimo dos micrófonos,
pero no hay un máximo. Unas de las mejores
configuraciones para captar sonido estereofónico son:
La configuración AB:
La configuración MS:
La configuración XY:
La configuración Blumlein:
Mesa de Sonido
Siempre tienen una salida de sonido estéreo, con L y R en un lado, a parte de los canales.
Los canales en estéreo tienen un potenciómetro de balance (BAL) que recibe una señal L y una
señal R. Se podrá potenciar una señal de sonido u otra según convenga, si el potenciómetro está
en el centro, ambas señales se oirán igual, pero si lo giras hacia algún lado, el contrario se oirá
menos en proporción.
Los faders tienen el cero arriba, porque hacen una mezcla sustractiva, quitan sonido.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Analógico vs. Digital
A nivel práctico, es mejor el digital, porque permite almacenar más información en menor
espacio. En cuanto a calidad, el analógico se va a degradar con el tiempo, mientras que el
digital mantendrá su calidad material por mucho tiempo que pase.
80% Analógico
Digitalización Receptor (Analógico)
20% Digital
Audio
200p El mínimo volumen que podemos oír es 0 decibelios, el
máximo, 140dz.
Zona de En cuanto a señal (vibración) sería un mínimo de 20Hz y
máximo de 200Hz.
trabajo
En fuerza se traducen a una presión mínima de 20mp (menos
20mp ∫ no oímos) y máxima 200p (más nos revienta el tímpano).
20 Hz 200 Hz
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266
Imagen
El mínimo de luz que podemos ver es 0 wits (menos no vemos)
10.000
y máximo serían 10.000 wits (más derrite la retina).
Zona de Podemos ver desde los 400 nanómetros hasta los 700, para ver
desde el azul hasta el rojo.
trabajo
Dentro de los límites, la resolución es infinita porque siempre
habrá algo que ampliar.
0
400 700
Pero dentro de estos límites, nuestra capacidad es casi infinita. Haciéndonos receptores casi
perfectos.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Su perfección es nuestro problema, porque eso implica que cualquier valor es válido, lo que
hace imposible separar lo útil (señal buena) de lo que ensucia la señal (ruido). El ruido es algo
inevitable pero que no queremos.
La peculiaridad de lo digital Aunque tenga ruido, se puede recuperar la señal digital a través
de su código binario.
Siempre que haya un procesado, es mejor el digital para deshacerse de ruido, porque el ruido
se genera en el procesado. Si el procesado es tan sencillo que no genera prácticamente ruido,
no vale la pena convertir a digital.
En analógico es posible haber omitido información importante al quitar ruido o que se nos
cuele ruido al intentar mantener el máximo de información. Como hay una infinidad de
posibilidades en cuanto a valores válidos, no podemos diferenciar un valor útil del ruido.
La ventaja de trabajar con una señal digital es que son altamente inmunes al ruido.
Desde el punto de vista físico, ambas señales son iguales, son electrones que pasan por un
cable conductor. En el analógico los electrones cambian de flujo, a veces llegan en una
cantidad a una velocidad, otras a otra. En digital o llegan electrones o no llegan.
Así cómo en las señales analógicas tenemos elementos físicos dentro de los procesadores, en
las “cajas” de procesado digital no, en estas hay puertas lógicas, componentes electrónicos
del mundo digital. Combinando adecuadamente estas puertas lógicas, podemos crear
cualquier circuito digital, pero a pesar de todo, cada puerta lógica acaba siendo un pequeño
circuito analógico (transistor) que solo comprende dos niveles de voltaje (0;1) y de ella sale
una señal nueva y pura, sin ruido.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
conversión al revés, porque nosotros (los usuarios) somos analógicos.
Lo que interesa es tener la etapa de conversión lo antes posible, porque así se corren menos
riesgos y tendremos menos ruido en la señal definitiva, igual que interesa que la etapa de
conversión digital a analógico sea lo más tarde posible. Por eso, con la gran apagada analógica
del 2010, los televisores tuvieron que incluir conversores D/A, para poder leer la Televisión
Digital Terrestre con los conectores analógicos, las televisiones más nuevas ya incluyeron ese
conversor en sí mismas.
Procesado
Pérdidas Pérdidas
Analógico Digital Analógico
A/D D/A
Pérdidas
Digital
Digital D/A Analógico
- Muestreo:
Consiste en tomar muestras, de una forma constante se analiza una señal y se toman
muestras de esta. Por lo que tenemos es una señal formada por muchos impulsos con
la misma amplitud que la señal original, la Pulse Amplitude Modilation (P.A.M).
Al muestrear, se pierde cierta información, por lo que cuanto más alta la frecuencia de
muestreo, menos información sacrificaremos. Es imposible no perder información,
porque una señal analógica es infinita y la señal digital requiere de un código que no es
infinito, en algún momento el código nos limitará el acceso a información.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266
Cuanta más muestras tenemos, más información tenemos, más pesan los archivos y
más lento el flujo de trabajo. Por lo que lo ideal es tomar el mínimo de muestras para
tener la calidad de señal que queremos. Siguiendo el teorema de Nyquist, cómo
mínimo la frecuencia de muestreo debe ser el doble de la máxima frecuencia que
queramos digitalizar. Las frecuencias de muestreo estándar en el sonido son:
1440 x 1080 High Definition (HD) 1920 x 1080 High Definition (HD)
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3840 x 2160 Ultra High Definition (UHD)
Todo esto teniendo en cuenta que el tamaño del pixel sea cuadrado, es decir, del Aspect
Ratio. Si grabamos una imagen en 4:3 y la proyección es en 16:9, el pixel se estiraría
(pixel anamórfico).
Cuando trabajamos con sonido, más muestreo implica más armónicos, es decir, más
sensibilidad a las altas frecuencias. Una alta resolución en sonido exige detalle.
Normalmente, en las cámaras de video muestrean las tres señales de R (Y), G (R-Y) y B
(B-Y) en paralelo, o que implica que teóricamente debería haber la misma frecuencia de
muestreo para las 3 señales digitales, pero no suele ser así. Las señales de color [(R-Y) +
(B-Y)] suelen tener una frecuencia de muestreo igual entre ellas, pero distinta a la señal
de luminancia (Y). En esos casos, aparecen subnormas de muestreo.
4:2:2 Todos los pixeles tienen luz, pero tenemos la mitad del color.
4:1:1 Todos los pixeles tienen luz, pero tenemos un cuarto del color.
4:2:0 Todos los pixeles tienen luz, pero tenemos un cuarto de color y algunas filas sin.
- Cuantificación:
Muchos sistemas tienen 256 niveles de cuantificación porque nuestro ojo no puede
captar más de 256 tipos de gris. Cuando trabajaos con una imagen con muy pocos
niveles, se provoca el “banding” y la imagen no coge todos los degradados y matices que
la realidad ofrece, faltan colores intermedios/de transición.
2n = cantidad de combinaciones
Al aumentar un bit la cuantificación, se duplica la cantidad de combinaciones de 0 y 1
que podemos hacer, por lo que aumentamos la información de grises en la
cuantificación y tendremos más grises entre el negro y el uno.
- Codificación:
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de la señal analógica en información en código binario, por lo que la convertimos en
señal digital.
0 1 1 0 1 0 0 1 0 0 0 0 1
1v 7
1
0v 0
Tanto en imagen como en sonido, si nos llega un archivo con pocos bits (profundidad de color
en el caso de la imagen) podemos añadirle ruido hasta encontrar el punto en el que nos sea
beneficioso para quitar el banding.
En el caso del sonido, el oído es mucho más sensible al captar impulsos sonoros, por lo que se
requieren muchísimos niveles para poder evaluar todos los rangos sonoros somos más
exigentes acústicamente.
Hoy en día, el video se rueda a 8 bits (256 niveles de cuantificación) o a 10 bits (1024 niveles),
el sonido, por otro lado, se registra a 16 (15625 niveles) bits o a 24 bits (millones).
Si un sonido estéreo trabaja a 44.100 a 16 bits, trabajará con 750.000 b/s por lado, por lo que
trabajará con 1,49 mb/s. Esa es la capacidad de un compact disc.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1225266
Y = 1920 x 1080 pixel/frame x8 x25 = 414.720.000 b/s En los televisores de casa no se puede
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4K – (4096 x 2160) 17:9 [Cine] 2K – (2048 x 1080)
UHD – (3840 x 2160) 16:9 [Cine] HD – (1920 x 1080)
Llamamos 4K a lo que realmente es UHD, porque la diferencia es mínima. Por eso se suele
grabar en la mayor resolución posible porque se pierde calidad en el proceso de compresión.
1302
Compresión.pdf
Compresión
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su
totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849
Compresión
En un mensaje hay siempre un componente muy importante que es redundante (redundancia)
y otra que es estrictamente necesaria (entropía). Suele haber una gran cantidad de redundancia
y poca entropía, por lo que podemos reducir peso comprimiendo/eliminando la redundancia.
Redundancia Buenos días, ¿podría traerme un café cuando le vaya bien, por favor?
Entropía
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tras haber comprimido un archivo, lo puedes descomprimir y recuperar
su tamaño inicial, aunque no tiene altos factores de compresión.
Estadísticas (VLC, RLC, etc.)
Ejemplo: Archivos RAW
Irreversibles/Lossy:
Los archivos comprimidos pesan menos, pero no se puede volver a
recuperar el peso total original, tiene altos factores de compresión, pero
mucho riesgo de perder información para siempre.
Transformados/ Espaciales (DCT, Wavelets)
Temporal (Estimación y compensación de movimiento.)
Ejemplo: Archivos .jpg
Se suelen combinar, aunque en el 98% de las ocasiones, en video se usan lossy, aunque
se trate de que no tengan una pérdida traumática de información. Combinando estos
tipos de compresión adecuadamente, podemos comprimir prácticamente cualquier
cosa, cada CODEC usa unos u otros.
Las técnicas de compresión estadísticas o entrópicas comprimen información de datos,
1 y 0, representen lo que representen. La probabilidad de aparición y combinación de 1
y 0 nos permitirá deducir técnicas más fáciles de codificación. Siempre son lossless, sin
pérdidas y reversibles.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1 tenemos puntos y rallas. El código Huffman también es un código de longitud variable.
Run Length Coding (RLC) 0000 = 0
0001 = 1
00000000001111111110000000000000000001111111111110000000 pesa 70 bits 0010 = 2
0011 = 3
10 “0” 9 “1” 15 “0” 12 “1” 7 “0”
0100 = 4
1010 0 1001 1 1111 0 1110 1 0111 0 pesa 25 bits 0101 = 5
0110 = 6
0111 = 7
1000 = 8
Los sistemas transformados transforman la realidad cambiando de dominio la 1001 = 9
información para comprimir (cargándose las altas frecuencias) y devolverlo al dominio 1010 = 10
original. 1011 = 11
1110 = 12
En el caso del sonido: pasando del dominio amplitud-tiempo al dominio amplitud- 1100 = 13
frecuencia. Tienen señales de mucha amplitud y de muy poca a la vez, porque tenemos 1101 = 14
1111 = 15
las altas y bajas frecuencia en una sola señal.
En el caso de la imagen: panado del domino temporal-espacial al dominio espectral (el
de las frecuencias) para comprimir
“Los sistemas transformados puede analizar un cuadro y saber en que % se ha usado
qué tipo de pincel.”
Discrete Cosine Transform (DCT)
A simple vista no podemos discernir que es comprimible y qué no en una fotografía,
como es imposible podemos recurrir a los sistemas transformados.
Pasamos del dominio del espacio/tiempo al dominio espectral (el dominio de las
frecuencias) a través de un proceso matemático, haciendo la inversa (DCT -1) volvemos
al dominio espacio/temporal. Una vez estamos en el dominio espectral eliminamos
aquella información que no queramos de forma controlada y precisa, para que no afecte
a la información que queremos mantener intacta.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esquina superior izquierda = Corriente Continua
o DC, nada de detalle.
Esquina inferior derecha = Corriente Alterna o
AC, máximo detalle.
A partir de cualquier imagen puede decirnos
cuales de estos patrones intervienen en y en qué porcentaje para formarla. Esto se
puede usar tanto para brillo como para color.
Este ejemplo, tendría muy poco detalle, pero aún teniendo una imagen con mucha
entropía, al coger bloques de 8x8 píxels, existe la posibilidad de que la distribución
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1321849
espectral quede centrada en los coeficientes de baja frecuencia. Esto quiere decir que,
al coger muestras tan pequeñas, el DCT no ve si la imagen en general tiene o no detalle,
sino la cantidad de detalle que tiene una muestra.
La DCT no comprime, sino que analiza la imagen, quien comprime es la matriz de
cuantificación. Los programas de compresión tienen varias matrices distintas según lo
mucho que quieras comprimir (cuando guardamos un .jpg en Photoshop en alta o baja
calidad, son matrices distintas), dividiendo el bloque analizado por la DCT por la matriz
de cuantificación, conseguimos un bloque con un menor peso porque tiene menos
detalle.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esto pesa 512 bits
Senyal
Senyal digital
analògic
FPB MOSTREJADOR QUANTIFICADOR CODIFICADOR
x(t)
Fm > 2 Fmax
@Xavier Bonet 1
Senyal de vídeo analògic
Camp I Camp II
1/50 s ≡ 20ms
@Xavier Bonet 2
1/25s ≡ 40ms
Mostratge Ortogonal
Línia 1
Línia 2
Línia 3
Línia 625
@Xavier Bonet 3
Senyal Digital en Components
(ITU-R601)
Y
retard 5.5Mhz A/D Y
8 bits
Paral·lel
U, V: 432 mostres per línia Mostratge Mostratge a
360 en part activa 6.75 Ms/s 13.5 Ms/s
Y: 864 mostres per línia (64us)
720 en part activa (53.3us).
@Xavier Bonet 4
Assignació de mostres
@Xavier Bonet 5
Assignació de mostres
@Xavier Bonet 6
Patrons de Mostratge d Imatge
4: 2: 2 4:1:1 4:2:0
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
xxxxxxxxx xxxxxxxxx xxxxxxxxx
X: component de Y
: components de U i V
@Xavier Bonet 7
Mostres Actives a cada Sistema
Cal comprimir
@Xavier Bonet la informació! 9
Compressió de vídeo
@Xavier Bonet 10
Necessitat de la Compressió
@Xavier Bonet 11
Redundància i entropia
@Xavier Bonet 12
Exemple d imatges amb elevada redundància
@Xavier Bonet 13
Exemple d imatges amb elevada entropia
@Xavier Bonet 14
Fonaments de la compressió
@Xavier Bonet 15
Tipus de compressió
@Xavier Bonet 16
Fonaments de la compressió de vídeo
@Xavier Bonet 17
Eliminació de la redundància espaial
@Xavier Bonet 18
Eliminació de la redundància estadística
@Xavier Bonet 19
Eliminació redundància temporal
@Xavier Bonet 20
Estimació i compensació de moviment
predicció Imatge
@Xavier Bonet n 21
Mètodes de compresió predictius
@Xavier Bonet 22
Mètodes de compressió predictius
@Xavier Bonet 23
Mètodes de compressió predictius
@Xavier Bonet 24
Mètodes de compressió estadístics
Probabilitat %
Alfabet
AEIOBS..........XKW
@Xavier Bonet 25
Mètodes de compresió estadístics
@Xavier Bonet 26
Mètodes de compressió transformats
@Xavier Bonet 27
Transformada Discreta del Cosinus (DCT)
@Xavier Bonet 28
Transformada Discreta del Cosinus (DCT)
@Xavier Bonet 29
Exemples de la DCT 2-D (8x8)
@Xavier Bonet 30
Ordre de Codificació dels Coeficients
@Xavier Bonet 31
Exemple
@Xavier Bonet 32
Wavelets
@Xavier Bonet 33
Wavelets
@Xavier Bonet 34
Wavelets
@Xavier Bonet 35
Wavelets
@Xavier Bonet 36
Wavelets
! El tamany de cada un dels mosaics són definits per la propia aplicació de codificació
o per l usuari, i s admet que tota la imatge estigui codificada com un tot. Els
resultats milloren quan la subimatge augmenta. A mesura que augmenta la
quantitat de subimatges en les que es realitza la descomposició, apareixen errors
de reconstrucció en els límits de les imatges. Degut a que habitualment la
transformada s aplica en una àrea gran de la imatge, es minimitza l efecte de
blocking que genera la DCT.
@Xavier Bonet 37
Circuit d estimació i compensació
de moviment
00110010111
+
DCT Q VLC
-
Q-1
Memòria DCT-1
+ +
Estimació
Memòria
moviment Compensació
moviment
Vectors
moviment
@Xavier Bonet 38
TECNOLOGIA AUDIOVISUAL
Analògic versus digital
Amplitud!
Màxim!
Un senyal analògic és continu en el
temps i la seva amplitud té una resolució
infinita. Pertant dins de les seves cotes Resolució ∞!
és un senyal perfecte.!
Mínim! Temps!
Temps continu!
Degut a que un senyal digital només té dos estats de polarització, quan es troba
“contaminat” de soroll és molt senzill regenerar-lo.!
Amplitud!
Màxim!
Llindar superior! !
Senyal degradat
Llindar inferior!
Mínim! Temps!
Senyal reconstruit !
Senyal
analògic
FPB
MOSTREJADOR
QUANTIFICADOR
CODIFICADOR
Senyal
digital
x(t)
El procés de mostreig, consisteix en avaluar de forma periòdica la amplitud del senyal que s'està digitalitzant. !
!
Un dels requisits que s’ha de contemplar al digitalitzar un senyal és el criteri de Nyquist. De no ser així no es pot
garantir un mínim de qualitat en la digitalització del senyal. A part que molt probablement es podria generar aliasing. !
Amplitud! !
PAM: Pulse Amplitude Modulation.
Màxim!
Mínim! Temps!
Sovint, tot i complir el criteri de Nyquist algunes components de molt alta freqüència poden generar
aliasing a baixa freqüència, és per aquesta raó que en la digitalització sempre s’utilitza un filtre anti-
aliasing abans del procés de mostreig. D’aquesta forma s’evita que cap component d’alta freqüència
pugui barrejar-se amb cap component del espectre resultant del procés de mostreig.!
A
Filtre anQ aliasing
f
F b F s 2Fs 3Fs
Nivell 6 - 110 Δ
E max =
Nivell 5 - 101
2
Nivell 4 - 100
Δ (n+1) bits, impliquen! S N = +3db' s
Nivell 3 - 101
Nivell 2 - 010
Nivell 1 - 001
Nivell 0 - 000
Amplitud!
111!
Seqüència temporal de les mostres codificades
!
110!
!
101!
010.010.100.110.011.011…
!
100!
!
011!
!
010!
!
001!
!
000! Temps!
010!
010!
100!
010!
110!
011!
011!
011!
110!
011!
110!
011!
111!
111!
111!
!
!
!
ESCAC @ Xavier Bonet 7
TECNOLOGIA AUDIOVISUAL
Digitalització d’un senyal d’àudio
• Observar que habitualment la codificació del so és realitza a 16 bits o 24 bits. Això és tradueix en 65.536 i 16.777.216 nivells de
quantificació respectivament. Per tant la dinàmica que s’aconsegueix treballant amb aquests valors és suficient per donar resposta a la
exigent dinàmica de la oïda humana. !
!
L’angle visual ve determinat per la distància de visionat i la mida de la pantalla. Per a conèixer la
resolució es necessari també conèixer la quantitat de píxels en la direcció vertical i horitzontal.!
α
b
1
Nv =
αn
OPTIMAL VIEWING
IMAGE SYSTEM! REFERENCE!
DISTANCE!
1280 1920
1080
pantalla, o es deforma la geometria de la imatge
mitjançant píxels anamòrfics. !
By Jedi787plus - hkps://en.wikipedia.org
ESCAC @ Xavier Bonet 16
TECNOLOGIA AUDIOVISUAL
Digitalització de vídeo per aplicacions professionals
Les recomanacions de la ITU especifiquen que un senyal de vídeo per aplicacions professionals s’hauria de
digitalitzar partint de un senyal RGB o en components (Y, R-Y, B-Y).!
R
QuanQficació
Y M o s t r e i g i
MATRIU Codificació
G
QuanQficació
R-Y M o s t r e i g i MulQplexor
Codificació
B
QuanQficació
B-Y M o s t r e i g i
Codificació
Conversor A/D
ESCAC @ Xavier Bonet 17
TECNOLOGIA AUDIOVISUAL
Normes de mostreig
Les normes de mostreig son una representació de la distribució dels píxels de llum i de color en la pantalla.!
!
La quantitat de mostres de Y defineixen la resolució de la imatge, per tant totes les imatges amb una mateixa resolució tenen la mateixa
quantitat de mostres de Y, independentment de la norma utilitzada.!
!
El motiu pel que existeixen normes diferents a la 4:4:4, és degut a la necessitat de reduir el volum d’informació i se sacrifica la croma enlloc de la
luma degut a que la visió humana té menys agudesa visual en el color que en la llum. !
!
Observar que tot i que les normes 4:1:1 i la 4:2:0 tenen una distribució diferent de les mostres de color, la quantitat de mostres en valor absolut
és la mateixa per tant el seu ample de banda també és el mateix.!
!
Norma 4:4:4! Norma 4:2:2 Norma 4:1:1! Norma 4:2:0!
X Mostra de lluminància Y
Mostra de color R-Y i B-Y
ESCAC @ Xavier Bonet 18
TECNOLOGIA AUDIOVISUAL
Existeix una variant!
!
Camp-1
Camp-2
La quantitat de bits amb els que es codifiqui el senyal de vídeo determinarà quants nivells de quantificació
s’utilitzaran per representar la amplitud del senyal. Per tant en el cas d’una imatge en blanc i negre (o per la
component Y), quan major sigui la la quantitat de bits, major serà la gama de grisos que es podrà
representar.!