Codificación y Compresión de Datos

Este documento trata sobre la codificación de datos en computadoras, incluyendo cómo se representan diferentes tipos de información como texto, audio, imágenes y video de forma digital mediante la asignación de códigos binarios. También explica diferentes técnicas de compresión de datos como sin pérdida, con pérdida, codificación de palabras clave y Huffman.

Cargado por

schupiakandres

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

66 vistas5 páginas

Codificación y Compresión de Datos

Cargado por

schupiakandres

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 5

Codificación

Datos y computadoras
Las computadoras son dispositivos multimedia, que manejan una amplia gama de
categorías de información.
Información
● Almacenan, presentan y nos ayudan a modificar:
● Números.
● Texto.
● Audio.
● Imágenes y gráficos.
● Vídeo.
Todo se almacena en forma de dígitos binarios (Bits)
Compresión de datos
Reducción en la cantidad de espacio necesario para almacenar un conjunto de datos o en el
ancho de banda para transmitir datos.
Índice de compresión
El tamaño de los datos comprimidos dividido por el tamaño de los datos originales.
Técnicas de compresión
● Sin pérdida: los datos se pueden recuperar sin ninguna pérdida de la información original.
● Con pérdida: cierta información puede perderse en el proceso de compresión.
Información analógica y digital
● Las computadoras almacenan información finita.
Representar un mundo infinito
Representamos suficiente información del mundo para satisfacer nuestras necesidades
computacionales y nuestros sentidos de la vista y el sonido.
● Datos analógicos: representación continua.
● Datos digitales: representación discreta. Dividir la información en elementos separados.
● Las computadoras no pueden trabajar bien con los datos analógicos, por lo que digitalizan
los datos.
● Digitalizar: Separar datos en piezas y representan esas piezas por separado.
Señales electrónicas
● Una señal analógica fluctúa continuamente de voltaje hacia arriba y abajo.
● Una señal digital tiene solamente un estado de alta o baja, que corresponden a los dos
dígitos binarios

Señal digital
Señal analógica
● Todas las señales electrónicas (analógicas y digitales) se degradan a medida que
avanzan por una línea.
● El voltaje de la señal fluctúa debido a los efectos ambientales.
Representar texto
¿Cómo representamos un documento de texto en formato digital?
Necesitamos poder representar cada posible carácter que puede aparecer en el texto.
El número de caracteres para representar es finito (¡menos mal!) => se asigna a cada letra o
símbolo imprimible un número único, y luego se almacena ese símbolo internamente usando
el equivalente binario de ese número.
Conjunto de caracteres
Una lista de los caracteres y los códigos utilizados para representar a cada uno.
ASCII
● ASCII son las iniciales de American Standard Code for Information Interchange.
● ASCII utilizó originalmente siete bits para representar cada carácter, lo que permite 128
caracteres únicos (usa un bit de paridad).
● Evolucionó a ASCII extendido de manera que se utilizaron los ocho bits.
● ¿Cuántos caracteres pueden ser representados?
● 256 caracteres
● Años 1940 y 1950: muchas codificaciones fueron diseñadas y utilizadas por distintos
equipos.
● Proliferación de problemas de comunicación.
● El Instituto Americano de Estándares Nacionales (ANSI) adoptó el Código ASCII.

PROBLEMA DE ASCII

ASCII extendido no es suficiente para el uso internacional

Solución….: UNICODE

UNICODE
● Originalmente utilizaba 16 bits por carácter.
● ¿Cuántos caracteres pueden ser representados?
● 65536 caracteres.
● Existe una versión compatible con ASCII.
● Versiones de UNICODE:
● UTF-8: (longitud variable: 8, 16, 24 o 32 bits).
● UTF-16: (longitud variable: 16 o 32 bits).
● UTF-32: (longitud fija: 32 bits).
● UTF-EBCDIC: (como UTF-8, compatible con EBCDIC).
Compresión de texto

Introducción

● Almacenamiento o ancho de banda escaso. ¿Cómo podemos almacenar y transmitir

datos de manera más eficiente?
● La compresión es más útil para archivos de gran tamaño (por ejemplo, audio, gráficos,
vídeo y datos científicos).
● Existen técnicas de compresión de texto sin pérdidas:
● codificación de palabras clave.
● RLE (run-length encoding).
● Codificación Huffman.

Codificación de palabra clave

Reemplazar los patrones de uso frecuente en un texto con un único carácter especial.
Ejemplo
Palabra Símbolo
As ^
The ~
And +
That $
Must &
Well %
Those #
The human body is composed of many independent systems, such ^ ~ circulatory system, ~ respiratory
system, + ~ reproductive system. Not only & each system work independently, they & interact + cooperate ^
%. Overall health is a function of ~ %-being of separate systems, ^ % ^ how # separate systems work in
concert.
Caracteres en el párrafo original: 349
Caracteres en el párrafo codificado: 314
Ahorro en caracteres: 35
El grado de compresión es: 314/349
Aproximadamente: 0,8997
Problemas
Texto con símbolos usados para la codificación (Ejemplo: $).
La palabra As es distinta a as.
No ganamos espacio codificando palabras de un solo carácter.

Alternativa
Reemplazar partes de palabras por símbolos.
RLE
En algunos tipos de archivos de datos, un único valor puede repetirse una y otra vez en una
secuencia larga.
Reemplazar una secuencia que se repite con una bandera (1 byte), el valor repetido
(1byte) y el número de repeticiones (1 byte).
Texto sin codificar: nnnnnxxxxxxxxxccchhhhhh some other text kkkkkkkkeee
Texto codificado: *n5*x9ccc*h6 some other text *k8eee
El grado de compresión es: 35/51
Aproximadamente: 0,6863
Se usa en:
Imágenes (pcx usa una variante).
Texto escaneado.
Codificación Huffman
Los caracteres 'X' y 'z' aparecen con menor frecuencia que los caracteres 'e' y ' '.
IDEA: Usar menos bits para los caracteres comunes (más frecuentes) a cambio de usar más
bits para los caracteres poco comunes (frecuentes).
Código Carácter
00 A
01 E
100 L
110 O
111 R
1010 B
1011 D

Texto sin codificar: DOORBELL

Texto codificado en binario: 1011110110111101001100100
El grado de compresión es: 25/64
Aproximadamente: 0,39

Tipos de técnica para determinar los códigos:

● General: el uso de letras en un idioma.
● Específico: basado en el texto a codificar o en determinados tipos de textos.
Sonido
Percibimos el sonido cuando una serie de compresiones de aire vibran la membrana
timpánica en el oído, que envía señales a nuestro cerebro.
Un sonido se define en la naturaleza por la onda de aire que interactúa con nuestro
tímpano.
Escuchamos música por un reproductor…
Se envía una señal eléctrica a cada altavoz, que luego vibra para producir sonido.
La señal controla el movimiento de una membrana en el altavoz, que a su vez crea las ondas
que llegan a los oídos.
La señal es una representación analógica de la onda sonora
● Digitalizar la señal mediante:
● Muestreo: medir periódicamente el voltaje.
● Cuantificación: representar el voltaje como un número usando un número finito de bits.
● ¿Con qué frecuencia debemos tomar las muestras?
● Una frecuencia de muestreo de aproximadamente 40.000 veces por segundo es
suficiente para crear una reproducción de sonido razonable.
Menor: produce distorsiones
Mayor: mejor calidad, puede no ser captada por el oído
Formatos de audio
● Formatos:
● WAV, AU, AIFF, VQF, y MP3
● Usan distintas técnicas de compresión
● MP3 (MPEG-2, audio layer 3 file):
● Basado en estudios de interrelación entre el oído y el cerebro, se elimina información de
frecuencia que no es percibida por los seres humanos.
● Compresión adicional usando una forma de codificación de Huffman.
Imágenes y color
El color es nuestra percepción de las distintas frecuencias de luz que llegan a la retinas de
los ojos.
● Nuestras retinas tienen tres tipos de conos fotorreceptores que responden a diferentes
conjuntos de frecuencias (rojo, verde y azul).
● Los otros colores se arman mediante la combinación de distintas cantidades de estos tres
colores.
● En los computadores se representan por 3 valores (RGB).
● Indican la contribución relativa de cada uno de los colores RGB.
Profundidad de color
● Es la cantidad de datos que se utiliza para representar un color.
Número de bits usados para representar un color
● Color de Alta Definición: profundidad de color de 15 o 16 bits (RGB 555, RGB 565).
● Color Verdadero: profundidad de color de 24 bits (RGB 888).
¿Cuantos colores se pueden representar?
● Color de Alta Definición: 32.768 o 65.536
● Color Verdadero: 16.777.216

Digitalizar una imagen

● Una fotografía es una representación analógica de una imagen.
● La digitalización de una imagen es el acto de representarlo como un conjunto de puntos
individuales denominados píxeles (elementos de la imagen).
● Cada píxel se compone de un solo color.
● El número de píxeles utilizados para representar una imagen se llama resolución.
Tipos de imágenes
● Gráficos de mapa de bits (Raster):
● Trata a la imagen como una colección de píxeles.
● Formatos: BMP, GIF, PNG y JPEG
● Gráficos vectoriales (Vector):
● Trata a la imagen como colección de objetos geométricos
● Formatos: Flash y SVG
Gráficos vectoriales
● Un gráfico es una serie de comandos que describen formas utilizando propiedades
matemáticas (por ejemplo, dirección, longitud, grosor, color).
● Dependiendo de la imagen, el tamaño del archivo puede ser menor que un mapa de bits.
Cuando usarlos
● Mapa de bits: imágenes del mundo real.
● Gráficos vectoriales: diagramas, logotipos, etc.
Videos
Códec
● Códec de vídeo (Compressor / DECompressor) métodos utilizados para reducir el tamaño
de una película para que pueda ser reproducida en un ordenador o por la red.
● Utilizan compresión con pérdida.
Tipos de compresión
● Temporal: basada en las diferencias entre fotogramas consecutivos.
● Espacial: basada en la eliminación de información repetitiva dentro de un fotograma.

También podría gustarte

Introduccion La Informatica Semana 5
Aún no hay calificaciones
Introduccion La Informatica Semana 5
27 páginas
Codificacion y Difusion Informacion Multimedia
Aún no hay calificaciones
Codificacion y Difusion Informacion Multimedia
53 páginas
Codificacion de La Informacion
Aún no hay calificaciones
Codificacion de La Informacion
3 páginas
Representación y Comunicación de La Información
Aún no hay calificaciones
Representación y Comunicación de La Información
9 páginas
Representación de La Información PDF
Aún no hay calificaciones
Representación de La Información PDF
17 páginas
Unidad 2 Unidades de Medida para El Alamacenamiento
Aún no hay calificaciones
Unidad 2 Unidades de Medida para El Alamacenamiento
3 páginas
Práctica Con Circuitos Lógicos
Aún no hay calificaciones
Práctica Con Circuitos Lógicos
5 páginas
Tema2-2011-Representacion de Texto y Numeros
Aún no hay calificaciones
Tema2-2011-Representacion de Texto y Numeros
13 páginas
Representación de La Información: Textos, Imágenes, Video y Audio
Aún no hay calificaciones
Representación de La Información: Textos, Imágenes, Video y Audio
8 páginas
Ta Fundamento 2
Aún no hay calificaciones
Ta Fundamento 2
5 páginas
P1
Aún no hay calificaciones
P1
112 páginas
Algortimos de Codificación - 25
Aún no hay calificaciones
Algortimos de Codificación - 25
8 páginas
Representacion de Los Datos Numericos
Aún no hay calificaciones
Representacion de Los Datos Numericos
95 páginas
I. Tipos de Datos
Aún no hay calificaciones
I. Tipos de Datos
22 páginas
Representación de Datos en Sistemas
Aún no hay calificaciones
Representación de Datos en Sistemas
25 páginas
Código Ansii
Aún no hay calificaciones
Código Ansii
5 páginas
Documentación Hardware Software
Aún no hay calificaciones
Documentación Hardware Software
37 páginas
1.2.6. La Computadora Personal Ideal para Programación
Aún no hay calificaciones
1.2.6. La Computadora Personal Ideal para Programación
4 páginas
Trabajo Robotica Gullermo & Mateo
Aún no hay calificaciones
Trabajo Robotica Gullermo & Mateo
7 páginas
Guía de HTML5 y CSS3 para Principiantes
0% (1)
Guía de HTML5 y CSS3 para Principiantes
48 páginas
Imagen Digital
Aún no hay calificaciones
Imagen Digital
65 páginas
ID Modulo 6 Compresion
Aún no hay calificaciones
ID Modulo 6 Compresion
12 páginas
Bits Bytes
Aún no hay calificaciones
Bits Bytes
51 páginas
Representación de La Información - Presentación
Aún no hay calificaciones
Representación de La Información - Presentación
25 páginas
Wuolah Premium UD1.2
Aún no hay calificaciones
Wuolah Premium UD1.2
5 páginas
Jimenez Alan #S1.2 Aut2
Aún no hay calificaciones
Jimenez Alan #S1.2 Aut2
4 páginas
Introducción a Conceptos de TIC
Aún no hay calificaciones
Introducción a Conceptos de TIC
24 páginas
Trabajo Autonomo 2
Aún no hay calificaciones
Trabajo Autonomo 2
4 páginas
Actividades - 3.1 - Geroli Torres Ramirez
Aún no hay calificaciones
Actividades - 3.1 - Geroli Torres Ramirez
4 páginas
Codigos Unicode y EBCDIC
Aún no hay calificaciones
Codigos Unicode y EBCDIC
8 páginas
Bits y Bytes
Aún no hay calificaciones
Bits y Bytes
4 páginas
U2M2 - Presentación - Representación de Datos
Aún no hay calificaciones
U2M2 - Presentación - Representación de Datos
11 páginas
CODIFICACION
Aún no hay calificaciones
CODIFICACION
1 página
Definición de Compresión
Aún no hay calificaciones
Definición de Compresión
5 páginas
Codficacion de Una Imagenz PDF
Aún no hay calificaciones
Codficacion de Una Imagenz PDF
8 páginas
Codificacion de Caracteres
Aún no hay calificaciones
Codificacion de Caracteres
1 página
Sistemas de Codificación
Aún no hay calificaciones
Sistemas de Codificación
1 página
2 4
Aún no hay calificaciones
2 4
10 páginas
Conceptos Computacionales II
Aún no hay calificaciones
Conceptos Computacionales II
13 páginas
Representacion de Datos
Aún no hay calificaciones
Representacion de Datos
3 páginas
Formatos de Imagen (1) Video Vigilancia Terminado
Aún no hay calificaciones
Formatos de Imagen (1) Video Vigilancia Terminado
12 páginas
Codigos Alfanumericos
Aún no hay calificaciones
Codigos Alfanumericos
7 páginas
Representación Binaria y Codificación
Aún no hay calificaciones
Representación Binaria y Codificación
7 páginas
Cap 3
Aún no hay calificaciones
Cap 3
62 páginas
Apuntes Unidad #4 2022 REPRESENTACIÓN DE DATOS
Aún no hay calificaciones
Apuntes Unidad #4 2022 REPRESENTACIÓN DE DATOS
44 páginas
Representación de La Información
Aún no hay calificaciones
Representación de La Información
25 páginas
Codigos Binarios y Alfanumericos
100% (1)
Codigos Binarios y Alfanumericos
9 páginas
Representación de Datos y Códigos
Aún no hay calificaciones
Representación de Datos y Códigos
29 páginas
Tema 2
Aún no hay calificaciones
Tema 2
6 páginas
Características de Los Sistemas Multimedia: Técnico Universitario en Informática
Aún no hay calificaciones
Características de Los Sistemas Multimedia: Técnico Universitario en Informática
6 páginas
Representación de Los Datos
Aún no hay calificaciones
Representación de Los Datos
19 páginas
Codigos Binarios
Aún no hay calificaciones
Codigos Binarios
16 páginas
CUP (Computacion) - Tema 4 v2 - Luis F. Veizaga
Aún no hay calificaciones
CUP (Computacion) - Tema 4 v2 - Luis F. Veizaga
29 páginas
P4.1 Codificación de Fuente
Aún no hay calificaciones
P4.1 Codificación de Fuente
3 páginas
Digitales Byron
Aún no hay calificaciones
Digitales Byron
7 páginas
Codficaciones (Modificado 2022) PDF
Aún no hay calificaciones
Codficaciones (Modificado 2022) PDF
5 páginas
Codigos
Aún no hay calificaciones
Codigos
5 páginas
Sistemas de Redes
Aún no hay calificaciones
Sistemas de Redes
102 páginas
Tema 1
Aún no hay calificaciones
Tema 1
10 páginas
Funciones 1 (Teoria)
Aún no hay calificaciones
Funciones 1 (Teoria)
24 páginas
Logica Proposicional (Teoria)
Aún no hay calificaciones
Logica Proposicional (Teoria)
57 páginas
Funciones 2 (Teoria)
Aún no hay calificaciones
Funciones 2 (Teoria)
31 páginas
Estructuras Algebraicas (Teoria)
100% (1)
Estructuras Algebraicas (Teoria)
29 páginas
Mapa Conceptual Lenguajes de Programación
70% (10)
Mapa Conceptual Lenguajes de Programación
1 página
Práctica4 Correcta
Aún no hay calificaciones
Práctica4 Correcta
20 páginas
Actividad 2
Aún no hay calificaciones
Actividad 2
4 páginas
Xtra INFORMaTICA APLICADA PRaCTICAS APRENDER A PROGRAMAR EN C
Aún no hay calificaciones
Xtra INFORMaTICA APLICADA PRaCTICAS APRENDER A PROGRAMAR EN C
396 páginas
Implementacion de PNETLab en ProxmoxVE
Aún no hay calificaciones
Implementacion de PNETLab en ProxmoxVE
52 páginas
Taller de Lego Mindstorms
Aún no hay calificaciones
Taller de Lego Mindstorms
18 páginas
Panasonic sc-tm40 Sa-Tm40 Su-Tm40
Aún no hay calificaciones
Panasonic sc-tm40 Sa-Tm40 Su-Tm40
21 páginas
Formato RDS
Aún no hay calificaciones
Formato RDS
14 páginas
Manual Básico de Informática
Aún no hay calificaciones
Manual Básico de Informática
299 páginas
Analisis de Menyes Brillantes (Steve Jobs Vs Bill Gates)
100% (1)
Analisis de Menyes Brillantes (Steve Jobs Vs Bill Gates)
4 páginas
Menú Detector de Metales IQ3 Formato
Aún no hay calificaciones
Menú Detector de Metales IQ3 Formato
24 páginas
Entregable 2 de Ciberseguridad
Aún no hay calificaciones
Entregable 2 de Ciberseguridad
12 páginas
StudioLive Series III OwnersManual V6 ES 10062019-2
Aún no hay calificaciones
StudioLive Series III OwnersManual V6 ES 10062019-2
164 páginas
PDF Examen Final Ccna 1 PDF DL
Aún no hay calificaciones
PDF Examen Final Ccna 1 PDF DL
14 páginas
Cisco 3800 Series - Español
Aún no hay calificaciones
Cisco 3800 Series - Español
17 páginas
Guía Rápida Instalación y Despliegue Agentes Redtrust
Aún no hay calificaciones
Guía Rápida Instalación y Despliegue Agentes Redtrust
8 páginas
Requerimientos
Aún no hay calificaciones
Requerimientos
26 páginas
Definición de Procesos
Aún no hay calificaciones
Definición de Procesos
6 páginas
Manual de PovRay
100% (1)
Manual de PovRay
147 páginas
Pec2 250
Aún no hay calificaciones
Pec2 250
14 páginas
Regulación y Automatización RTVX
Aún no hay calificaciones
Regulación y Automatización RTVX
4 páginas
Reseña Historica Computadoras
Aún no hay calificaciones
Reseña Historica Computadoras
16 páginas
ACEII1902 - Taller 2
Aún no hay calificaciones
ACEII1902 - Taller 2
5 páginas
Protocolos 1-3
Aún no hay calificaciones
Protocolos 1-3
10 páginas
Leccion 2 Actividad PDF
Aún no hay calificaciones
Leccion 2 Actividad PDF
2 páginas
Análisis Básico de Circuitos Eléctricos
Aún no hay calificaciones
Análisis Básico de Circuitos Eléctricos
20 páginas
Examen Cisco Ultimo 2023-Parte2
Aún no hay calificaciones
Examen Cisco Ultimo 2023-Parte2
76 páginas
Laboratorio 14 Pt1automatizacion Con PLC I
Aún no hay calificaciones
Laboratorio 14 Pt1automatizacion Con PLC I
8 páginas
Qué Es Window
Aún no hay calificaciones
Qué Es Window
6 páginas
Guía de La Comunicación RS485
Aún no hay calificaciones
Guía de La Comunicación RS485
14 páginas