[go: up one dir, main page]

0% encontró este documento útil (0 votos)
66 vistas5 páginas

Codificación y Compresión de Datos

Este documento trata sobre la codificación de datos en computadoras, incluyendo cómo se representan diferentes tipos de información como texto, audio, imágenes y video de forma digital mediante la asignación de códigos binarios. También explica diferentes técnicas de compresión de datos como sin pérdida, con pérdida, codificación de palabras clave y Huffman.

Cargado por

schupiakandres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
66 vistas5 páginas

Codificación y Compresión de Datos

Este documento trata sobre la codificación de datos en computadoras, incluyendo cómo se representan diferentes tipos de información como texto, audio, imágenes y video de forma digital mediante la asignación de códigos binarios. También explica diferentes técnicas de compresión de datos como sin pérdida, con pérdida, codificación de palabras clave y Huffman.

Cargado por

schupiakandres
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 5

Codificación

Datos y computadoras
Las computadoras son dispositivos multimedia, que manejan una amplia gama de
categorías de información.
Información
● Almacenan, presentan y nos ayudan a modificar:
● Números.
● Texto.
● Audio.
● Imágenes y gráficos.
● Vídeo.
Todo se almacena en forma de dígitos binarios (Bits)
Compresión de datos
Reducción en la cantidad de espacio necesario para almacenar un conjunto de datos o en el
ancho de banda para transmitir datos.
Índice de compresión
El tamaño de los datos comprimidos dividido por el tamaño de los datos originales.
Técnicas de compresión
● Sin pérdida: los datos se pueden recuperar sin ninguna pérdida de la información original.
● Con pérdida: cierta información puede perderse en el proceso de compresión.
Información analógica y digital
● Las computadoras almacenan información finita.
Representar un mundo infinito
Representamos suficiente información del mundo para satisfacer nuestras necesidades
computacionales y nuestros sentidos de la vista y el sonido.
● Datos analógicos: representación continua.
● Datos digitales: representación discreta. Dividir la información en elementos separados.
● Las computadoras no pueden trabajar bien con los datos analógicos, por lo que digitalizan
los datos.
● Digitalizar: Separar datos en piezas y representan esas piezas por separado.
Señales electrónicas
● Una señal analógica fluctúa continuamente de voltaje hacia arriba y abajo.
● Una señal digital tiene solamente un estado de alta o baja, que corresponden a los dos
dígitos binarios

Señal digital
Señal analógica
● Todas las señales electrónicas (analógicas y digitales) se degradan a medida que
avanzan por una línea.
● El voltaje de la señal fluctúa debido a los efectos ambientales.
Representar texto
¿Cómo representamos un documento de texto en formato digital?
Necesitamos poder representar cada posible carácter que puede aparecer en el texto.
El número de caracteres para representar es finito (¡menos mal!) => se asigna a cada letra o
símbolo imprimible un número único, y luego se almacena ese símbolo internamente usando
el equivalente binario de ese número.
Conjunto de caracteres
Una lista de los caracteres y los códigos utilizados para representar a cada uno.
ASCII
● ASCII son las iniciales de American Standard Code for Information Interchange.
● ASCII utilizó originalmente siete bits para representar cada carácter, lo que permite 128
caracteres únicos (usa un bit de paridad).
● Evolucionó a ASCII extendido de manera que se utilizaron los ocho bits.
● ¿Cuántos caracteres pueden ser representados?
● 256 caracteres
● Años 1940 y 1950: muchas codificaciones fueron diseñadas y utilizadas por distintos
equipos.
● Proliferación de problemas de comunicación.
● El Instituto Americano de Estándares Nacionales (ANSI) adoptó el Código ASCII.

PROBLEMA DE ASCII

ASCII extendido no es suficiente para el uso internacional

Solución….: UNICODE

UNICODE
● Originalmente utilizaba 16 bits por carácter.
● ¿Cuántos caracteres pueden ser representados?
● 65536 caracteres.
● Existe una versión compatible con ASCII.
● Versiones de UNICODE:
● UTF-8: (longitud variable: 8, 16, 24 o 32 bits).
● UTF-16: (longitud variable: 16 o 32 bits).
● UTF-32: (longitud fija: 32 bits).
● UTF-EBCDIC: (como UTF-8, compatible con EBCDIC).
Compresión de texto

Introducción

● Almacenamiento o ancho de banda escaso. ¿Cómo podemos almacenar y transmitir


datos de manera más eficiente?
● La compresión es más útil para archivos de gran tamaño (por ejemplo, audio, gráficos,
vídeo y datos científicos).
● Existen técnicas de compresión de texto sin pérdidas:
● codificación de palabras clave.
● RLE (run-length encoding).
● Codificación Huffman.

Codificación de palabra clave

Reemplazar los patrones de uso frecuente en un texto con un único carácter especial.
Ejemplo
Palabra Símbolo
As ^
The ~
And +
That $
Must &
Well %
Those #
The human body is composed of many independent systems, such ^ ~ circulatory system, ~ respiratory
system, + ~ reproductive system. Not only & each system work independently, they & interact + cooperate ^
%. Overall health is a function of ~ %-being of separate systems, ^ % ^ how # separate systems work in
concert.
Caracteres en el párrafo original: 349
Caracteres en el párrafo codificado: 314
Ahorro en caracteres: 35
El grado de compresión es: 314/349
Aproximadamente: 0,8997
Problemas
Texto con símbolos usados para la codificación (Ejemplo: $).
La palabra As es distinta a as.
No ganamos espacio codificando palabras de un solo carácter.

Alternativa
Reemplazar partes de palabras por símbolos.
RLE
En algunos tipos de archivos de datos, un único valor puede repetirse una y otra vez en una
secuencia larga.
Reemplazar una secuencia que se repite con una bandera (1 byte), el valor repetido
(1byte) y el número de repeticiones (1 byte).
Texto sin codificar: nnnnnxxxxxxxxxccchhhhhh some other text kkkkkkkkeee
Texto codificado: *n5*x9ccc*h6 some other text *k8eee
El grado de compresión es: 35/51
Aproximadamente: 0,6863
Se usa en:
Imágenes (pcx usa una variante).
Texto escaneado.
Codificación Huffman
Los caracteres 'X' y 'z' aparecen con menor frecuencia que los caracteres 'e' y ' '.
IDEA: Usar menos bits para los caracteres comunes (más frecuentes) a cambio de usar más
bits para los caracteres poco comunes (frecuentes).
Código Carácter
00 A
01 E
100 L
110 O
111 R
1010 B
1011 D

Texto sin codificar: DOORBELL


Texto codificado en binario: 1011110110111101001100100
El grado de compresión es: 25/64
Aproximadamente: 0,39

Tipos de técnica para determinar los códigos:


● General: el uso de letras en un idioma.
● Específico: basado en el texto a codificar o en determinados tipos de textos.
Sonido
Percibimos el sonido cuando una serie de compresiones de aire vibran la membrana
timpánica en el oído, que envía señales a nuestro cerebro.
Un sonido se define en la naturaleza por la onda de aire que interactúa con nuestro
tímpano.
Escuchamos música por un reproductor…
Se envía una señal eléctrica a cada altavoz, que luego vibra para producir sonido.
La señal controla el movimiento de una membrana en el altavoz, que a su vez crea las ondas
que llegan a los oídos.
La señal es una representación analógica de la onda sonora
● Digitalizar la señal mediante:
● Muestreo: medir periódicamente el voltaje.
● Cuantificación: representar el voltaje como un número usando un número finito de bits.
● ¿Con qué frecuencia debemos tomar las muestras?
● Una frecuencia de muestreo de aproximadamente 40.000 veces por segundo es
suficiente para crear una reproducción de sonido razonable.
Menor: produce distorsiones
Mayor: mejor calidad, puede no ser captada por el oído
Formatos de audio
● Formatos:
● WAV, AU, AIFF, VQF, y MP3
● Usan distintas técnicas de compresión
● MP3 (MPEG-2, audio layer 3 file):
● Basado en estudios de interrelación entre el oído y el cerebro, se elimina información de
frecuencia que no es percibida por los seres humanos.
● Compresión adicional usando una forma de codificación de Huffman.
Imágenes y color
El color es nuestra percepción de las distintas frecuencias de luz que llegan a la retinas de
los ojos.
● Nuestras retinas tienen tres tipos de conos fotorreceptores que responden a diferentes
conjuntos de frecuencias (rojo, verde y azul).
● Los otros colores se arman mediante la combinación de distintas cantidades de estos tres
colores.
● En los computadores se representan por 3 valores (RGB).
● Indican la contribución relativa de cada uno de los colores RGB.
Profundidad de color
● Es la cantidad de datos que se utiliza para representar un color.
Número de bits usados para representar un color
● Color de Alta Definición: profundidad de color de 15 o 16 bits (RGB 555, RGB 565).
● Color Verdadero: profundidad de color de 24 bits (RGB 888).
¿Cuantos colores se pueden representar?
● Color de Alta Definición: 32.768 o 65.536
● Color Verdadero: 16.777.216

Digitalizar una imagen


● Una fotografía es una representación analógica de una imagen.
● La digitalización de una imagen es el acto de representarlo como un conjunto de puntos
individuales denominados píxeles (elementos de la imagen).
● Cada píxel se compone de un solo color.
● El número de píxeles utilizados para representar una imagen se llama resolución.
Tipos de imágenes
● Gráficos de mapa de bits (Raster):
● Trata a la imagen como una colección de píxeles.
● Formatos: BMP, GIF, PNG y JPEG
● Gráficos vectoriales (Vector):
● Trata a la imagen como colección de objetos geométricos
● Formatos: Flash y SVG
Gráficos vectoriales
● Un gráfico es una serie de comandos que describen formas utilizando propiedades
matemáticas (por ejemplo, dirección, longitud, grosor, color).
● Dependiendo de la imagen, el tamaño del archivo puede ser menor que un mapa de bits.
Cuando usarlos
● Mapa de bits: imágenes del mundo real.
● Gráficos vectoriales: diagramas, logotipos, etc.
Videos
Códec
● Códec de vídeo (Compressor / DECompressor) métodos utilizados para reducir el tamaño
de una película para que pueda ser reproducida en un ordenador o por la red.
● Utilizan compresión con pérdida.
Tipos de compresión
● Temporal: basada en las diferencias entre fotogramas consecutivos.
● Espacial: basada en la eliminación de información repetitiva dentro de un fotograma.

También podría gustarte