CAPITULO 2
Introducción a las Bases
de Datos
COM 203 Almacenamiento de la Información
1.- Introducción a las Bases de Datos
El uso de una Base de Datos se encuentra en cualquier parte
de nuestra vida cotidiana en el mundo informatizado.
Ejemplo:
Cuando una persona se dirige al banco a depositar o retirar
dinero.
Cuando se realiza una reserva en un hotel o una aerolínea.
Cuando se realizan compras por internet.
Cuando se compran accesorios en el supermercado.
Juegos en línea que almacenan estados, puntos, perfiles u
otros aspectos.
Aplicaciones que usan Bases de datos
Estos ejemplos son comúnmente conocidos como
“aplicaciones tradicionales con Bases de Datos”
Aplicaciones mas recientes:
YouTube.
iTunes.
Sistemas de información geográfica (SIG).
Data Warehouse.
Y otras aplicaciones.
Complejidad y tamaño de las Bases
de Datos
Por ejemplo:
Una Lista de Nombres y Direcciones.
IMPUESTOS NACIONALES.
(Imagina la cantidad de comerciantes y contribuyentes que se
dedican a algún negocio y deben constantemente realizar
movimientos monetarios, impuestos, etc.).
Amazon.com
(15 millones de personas visita cada día este sitio, alrededor 100
de estas personas realizan compras y originan una
actualización de la Base de Datos).
Sistemas de Bases de Datos
Base de Datos: Una colección de datos relacionados.
Datos: Dato es un conjunto de caracteres con algún
significado, pueden ser numéricos, alfabéticos o
alfanuméricos.
Información: Es un conjunto ordenado de datos los cuales
son manejados según la necesidad del usuario.
Sistema de gestión de Bases de Datos-Database
Management System (DBMS): Un Software paquete/sistema
que facilita la Definición, Construcción, Manipulación y la
personalización de funciones de una base de datos
Computarizada.
Conceptos Básicos
Campo, es la unidad más pequeña a la cual uno
puede referirse en un programa. Desde el punto de
vista del programador representa una característica de
un individuo u objeto.
Registro, es una colección de campos de iguales o de
diferentes tipos.
Archivo, es una colección de registros almacenados
siguiendo una estructura homogénea.
Conceptos Básicos
Bases de datos, es un conjunto exhaustivo (en su
modelización del mundo real) de datos estructurados,
fiables y homogéneos, organizados
independientemente de su utilización y de su
implementación en máquina, accesibles en tiempo
real, compartibles por usuarios concurrentes que tienen
necesidades de información diferentes y no predecibles
en el tiempo.
Base de Datos = Estructura + Datos.
Conceptos Básicos
Base de datos:
• Es una colección de archivos interrelacionados, son creados
con un DBMS.
• Una finalidad de la base de datos es eliminar la redundancia o
al menos minimizarla.
• El contenido de una base de datos engloba a la información
concerniente (almacenadas en archivos) de una organización,
de tal manera que los datos estén disponibles para los usuarios.
Ejemplo: Una Biblioteca
Componentes de un sistema de base
de datos (SBD)
Los componentes principales de un sistema de base de
datos son:
El hardware
El software DBMS
Los datos a manejar
El personal encargado del manejo del sistema.
Sistema de gestión de Base de Datos
(DBMS)
Un DBMS es una colección de numerosas rutinas de
software interrelacionadas, cada una de las cuales es
responsable de una tarea específica.
El objetivo de un sistema manejador base de datos es
proporcionar un entorno que sea a la vez conveniente y
eficiente para ser utilizado al extraer, almacenar y
manipular información de la base de datos.
Es un conjunto de programas que permite a los usuarios
crear y mantener una BD
Funcionalidad Básica de DBMS
Define una base de datos particular en términos y base de
sus tipos de datos, estructuras y restricciones.
Se construye y se inicializa a través de este.
Manipula la Base de Datos:
Recuperación: Consultas, generación de Informes.
Modificación: Inserciones, eliminaciones y actualizaciones al
contenido
Acceso a la base de Datos por medio de aplicaciones Web
y otros.
Proporciona la opción de compartir una base de datos para
que múltiples usuarios y programas puedan acceder a la
misma de manera simultánea.
Entorno de Funcionamiento
2.- Ejemplo
Universidad
Este pequeño ejemplo contiene información relacionada
a los docentes que dictan alguna materia y la
matriculación y asignación de la misma
Tenemos:
DOCENTES.- Responsable de impartir clases.
CURSOS.- Asignaturas disponibles.
ENSEÑA.- La Asignación correspondiente de una
Asignatura hacia un docente en un determinado
Semestre
Esquema de la Base de datos
Es la estructura por la que está formada la base de datos,
se especifica por medio de un conjunto de definiciones
que se expresa mediante un lenguaje especial llamado
lenguaje de definición de datos. (DDL)
Administración y manipulación de BD
La administración y manipulación de un BD involucra
consultas y actualizaciones
Algunos ejemplos de Consulta:
Listar los Docentes titulares.
Listar los cursos que no han sido dictados ningún semestre
Algunos ejemplos de Actualización:
Asignar el Tipo de Docente ‘T’ (TITULAR) al docente ‘Fernando
Ayala’
3.- Características de Una Base de
Datos.
Bases de datos vs Archivos y Ficheros
Dentro de una base de Datos, un simple repositorio de
datos es definido una sola vez y el acceso a la
información es compartida, es decir varios usuarios
pueden acceder a la misma
Las diferencias más marcadas entre un BD y un Archivo
son:
Descripción propia de la Base de Datos
Independencia entre los datos y los Programas
Soporte para múltiples vistas y presentaciones de los datos
Compartimiento de los datos y procesamiento transaccional
para múltiples usuarios
Descripción propia de una Base de
Datos
Una base de datos no solo contiene en si misma solo la
información, también tiene una definición complete de
la estructura de los datos y las restricciones que existen.
La información almacenada en los catálogos es
conocida como Meta-Datos y esta describe la
estructura de la base de datos primaria.
Ejemplo Meta-datos
Independencia entre los datos y los
programas
En el procesamiento de un archivo, si existiese alguna
modificación a la estructura, seguramente se
necesitaría readecuar todos los programas que
acceden a dicho archivo.
En un sistema Gestor de Base de Datos, la estructura de
los datos se encuentra almacenada en el Catálogo del
DBMS de manera separada para facilitar el acceso a
los programas que hacen uso de la BD.
Esto es conocido como Independencia de Programas-
Datos
Soporte para múltiples vistas y
presentaciones de los datos
Cada usuario puede ver diferentes vistas y
presentaciones de la base de datos, que solo describen
la información de interés para ese usuario
También la presentación de la información puede ser a
través datos virtuales que son generados por la base de
datos pero que no son almacenadas dentro de la
misma.
Compartimiento de los datos y
procesamiento transaccional para múltiples
usuarios
Una base de datos permite que simultáneamente varios usuarios
puedan realizar distintas operaciones sobre la misma como
consultar y actualizar la base de datos.
El Control concurrente dentro de un DBMS garantiza que cada
operación o transacción sea correctamente ejecutada o en todo
caso abortada o cancelada
Por ejemplo, cuando existe una demanda grande de clientes que
desean reservar un asiento de viaje en una Aerolínea en un mismo
instante.
estos tipos de aplicaciones son conocidas como online transaction
processing (OLTP).
4.- Elementos participantes
Administradores de Bases de Datos:
responsable de autorizar el acceso a la BD, para la
coordinación y monitoreo de su uso, se encargan de administrar
los recursos de software y hardware monitoreando la eficiencia
de las transacciones y operaciones.
Diseñadores de Bases de Datos:
responsable de definir el contenido, la estructura, las
restricciones y las funcionalidades o transacciones que se
ejecutan dentro de la BD. Ellos deben comunicarse con los
usuarios finales complacer los requerimientos de los mismos
Usuarios Finales
Analistas de Sistemas
5.- Ventajas del uso de Sistemas de
gestión de Bases de datos. (SGBD)
Control de redundancia
El Control de Redundancia es una de las tareas más
importantes de un DBMS
Cada conjunto de Datos mantiene
independientemente su propia información.
Dado que los archivos son creados por diferentes tipos
de programas de aplicación, existe la posibilidad de
que, si no se controla detalladamente el
almacenamiento, se pueda originar un duplicado de
información, es decir que la misma información se
encuentre más de una vez en un dispositivo de
almacenamiento.
Control de redundancia
La redundancia de la información al momento de
almacenarla conlleva muchas veces a varios
problemas:
Criterios de Actualización, cuando se necesita actualizar varias
veces.
Espacio de almacenamiento desperdiciado.
Los datos que representan la misma información pueden causar
confusiones debido a su inconsistencia
Otras ventajas del uso de SGBD
Restricción al acceso de la información no autorizada.
Proporciona estructuras de almacenamiento (Por ejemplo:
índices) para un eficiente procesamiento de consulta.
Proporciona Copias de Seguridad y servicios de
Recuperación.
Proporciona interfaces múltiples de diferentes clases para los
usuarios.
Representación de relaciones complejas entre la información
almacenada.
Aislamiento de los datos.
Otras ventajas del uso de SGBD
Seguridad de la información.
La información de toda empresa es importante, aunque unos
datos lo son más que otros, por tal motivo se debe considerar el
control de acceso a los mismos.
No todos los usuarios pueden visualizar alguna información, por
tal motivo para que un sistema de base de datos sea confiable
debe mantener un grado de seguridad que garantice la
autentificación y protección de los datos.
6.- Abstracción de datos
Un objetivo importante de un sistema de base de datos es
proporcionar a los usuarios una visión abstracta de los
datos, es decir, el sistema esconde ciertos detalles de
cómo se almacenan y mantienen los datos.
Niveles de Abstracción
Existen diferentes niveles de abstracción para simplificar la
interacción de los usuarios con el sistema:
Interno-Físico
Conceptual
Externo-Visión
Nivel físico
Es la representación del nivel más bajo de abstracción.
En éste se describe en detalle la forma en como de
almacenan los datos en los dispositivos de
almacenamiento
Por ejemplo, mediante índices para el acceso aleatorio
a los datos.
Nivel Conceptual
El siguiente nivel (más alto) de abstracción.
Describe que datos son almacenados realmente en la
base de datos y las relaciones que existen entre los
mismos.
Describe la base de datos completa en términos de su
estructura de diseño.
Definiciones en el nivel conceptual
Consta de las siguientes definiciones:
Definición de los datos:
Se describen el tipo de datos y la longitud de campo todos los
elementos direccionables en la base. Los elementos por definir
incluyen artículos elementales (atributos), totales de datos y
registros conceptuales (entidades).
Relaciones entre datos:
Se definen las relaciones entre datos para enlazar tipos de
registros relacionados para el procesamiento de archivos
múltiples.
Nivel de visión
Nivel más alto de abstracción, es lo que el usuario final
puede visualizar del sistema terminado.
Describe sólo una parte de la base de datos al usuario
acreditado para verla.
Modelos de Base de Datos
Planas: No se verifica la consistencia de los datos. (¡No
es una base de datos!)
Jerárquicas: Fichas, Jerarquía.
Red: Registro, Campo, Conjunto,
Relacionales: Tablas, Registros, Atributos y Relaciones.
Objetos: Clases, Objetos y Mensajes.
Otras necesidades
No solo de las operaciones depende el diseño. También
de otros requerimientos y funcionalidades.
Muchas veces depende de los recursos que se tienen.
Como consecuencia fue necesario clasificar las bases
de datos según la distribución de física de los datos.
Organización Física
Centralizada.
Existe un único repositorio responsable de los datos.
La consulta se realiza sobre el repositorio.
Distribuida.
Existen varios repositorios responsables de los datos.
La consulta se realiza en cualquiera de los repositorios.
El usuario ve un único repositorio.
Existe un proceso de sincronización de los datos.
Organización Física
Mixta
Existen varios repositorios responsables de los datos.
La consulta se realiza en el repositorio adecuado.
La interconexión entre los repositorios pueden ser visible o
invisible.
Existen procesos independientes a los repositorios que realizan la
sincronización.
La forma de distribución y almacenamiento de datos
es heterogénea.