Esta clase va a ser
grabada
¿Dudas sobre el
onboarding?
Míralo aquí
Clase 02. DATA ANALYTICS
Base de datos
Temario
01 02 03
Data Analytics Bases de datos Bases de datos
relacionales
✓ Data Analytics ✓ Base de datos
✓ Modelo
✓ Tipos de análisis ✓ Data Warehouse relacional
de datos ✓ Guía para ✓ Modelo entidad
seleccionar la - relación
✓ Tecnologías que
fuente de
intervienen en el
información ✓ Diagrama E - R
análisis de datos
Objetivos de la clase
Conocer qué es una base de datos y sus
generalidades.
Identificar los componentes de una base de
datos.
Identificar los tipos de bases de datos.
Integrar conocimientos generales de Data
Warehouse.
Base de datos
Introducción
Los temas que veremos en esta clase
son introductorios.
En nuestro módulo de base de datos
relacionales profundizaremos en los
más importantes.
¿Qué es una base
de datos?
Un conjunto de datos almacenados en un formato
específico e interrelacionados por un contexto en
común
Componentes de una
base de datos
Información
La información se obtiene de la base de
datos, está integrada y además es
compartida.
SGBD: sistema de gestión de
base de datos
Sistema de gestión de base de datos (DBMS por sus
siglas en inglés). Ej: Oracle, MySQL, SQLServer, Access,
entre otros.
Aplicaciones que han sido diseñadas para gestionar
grandes cantidades de información.
Hardware
- Almacenamiento secundario.
- Procesadores, memoria, etc.
Usuarios
- Aplicaciones y Personas que
interactúan con la BD
¡Nosotros
usaremos este!
La gestión de los datos implica tanto la definición de
estructuras para almacenar la información como la
provisión de mecanismos para la manipulación de la
información.
Características de un SGBD
Recuperación Concurrencia Integridad Seguridad
Capacidad de Permiten que Esta característica del Garantiza la
proteger los muchas sistema de gestión de seguridad a toda la
datos ante fallos transacciones base de datos información
en el sistema o puedan acceder monitoriza que la base almacenada
en las a una misma de datos mantenga una mediante un sistema
aplicaciones. base de datos a congruencia con cada autónomo encargado
la vez. campo agregado, ya de administrar la
sea en una forma privacidad y
individual y en una garantizar el buen uso
colectiva. de los datos.
Modelo de base de datos
Concepto
Un modelo de base de datos permite generar la estructura
lógica de la base, incluidas las relaciones y limitaciones
que determinan cómo se almacenan los datos y cómo se
accede a ellos.
Tipos de modelos de
base de datos
¡Nosotros usaremos este!
Relacional Entidad - Relación
Colección de tablas para representar Percepción del mundo real que consiste
tanto los datos como sus relaciones en una colección de objetos básicos,
denominados entidades, y de las
relaciones entre ellos
Orientado a objetos No Relacional
La información se representa mediante No tienen un identificador que sirva de
objetos como los presentes en la relación entre un conjunto de datos y otros
programación orientada a objetos.
Red
Jerárquico
Los datos son organizados en una Set de registros, los cuales están
estructura parecida a un árbol conectados entre sí por medio de enlaces
en una red
Argentina
Brasil México Chile Brasil México Chile
Modelado de base de
datos
Concepto
Permite definir la estructura y comunicarse con una base
de datos. Típicamente permite describir:
Estructuras de
datos
Las estructuras de datos de la base: el tipo de datos que
hay en la base y la forma en que se relacionan.
Restricciones de
integridad
Las restricciones de integridad: Un conjunto de
condiciones que deben cumplir los datos para reflejar la
realidad deseada.
Operaciones de
manipulación
Operaciones de manipulación de los datos:
generalmente, operaciones de agregado,
borrado, modificación y recuperación de los
datos de la base.
Lenguajes de consultas
estructuradas
Lenguajes de
consultas
estructuradas
Los sistemas de gestión proporcionan un lenguaje de
definición para especificar el esquema de la base de
datos y un lenguaje de manipulación para expresar las
consultas y las modificaciones de la base.
Structured Query Language
Sublenguajes de
SQL
Data Definition Language: Data Manipulation Language:
Permite crear, modificar y
eliminar estructuras.
DDL DML Permite modificar el contenido.
Data Control Language: Permite DCL TCL Transaction Control Language:
asignar y modificar permisos. Permite gestionar transacciones.
DATAWAREHOUSE
Concepto
Permite a una organización o empresa ejecutar análisis
potentes en grandes volúmenes (petabytes y petabytes)
de datos históricos de formas que una base de datos
estándar simplemente no puede.
☕
Break
¡10 minutos y volvemos!
Base de datos en una
arquitectura de red
Diseñarán el diagrama de una arquitectura de red, vista en
la vida cotidiana, y resaltarán las bases de datos que allí
podemos encontrar.
Duración: 25 minutos de trabajo individual + 15 minutos de
puesta en común
ACTIVIDAD EN CLASE
Las bases de datos están en
todos lados
Descripción de la actividad.
Una arquitectura de red es la conexión de varios dispositivos por medio de una red
cableada o WiFi. Por ejemplo, nuestro modem en casa conecta al mismo tiempo a nuestros
celulares y computadoras con nuestros almacenamientos en la nube o impresora.
1. En base al diagrama de ejemplo (siguiente slide), crearás un diagrama en el que se
puedan identificar al menos tres bases de datos.
ACTIVIDAD EN CLASE
Las bases de datos están en
todos lados
2. La red puede ser real o ficticia. Podemos inspirarnos en una empresa, escuela,
universidad o hasta nuestra propia casa.
3. Durante 15 minutos te reunirás con tu equipo para desarrollar el desafío y, luego de
esto, haremos una puesta en común para debatir con el resto de la clase.
Ejemplo
Para pensar
Contestar la encuesta de ZOOM
3era PRÁCTICA HACIA EL PROYECTO FINAL
Definición de la fuente de información
Consigna Aspectos a incluir:
Presentar (máximo) tres sets de datos ✓ Cada set de datos debe contener al
que puedan ser usados como fuente de menos diez columnas con datos. Si
información para sus proyectos finales. contiene varias hojas también es
aceptado.
IMPORTANTE: La información será ✓ Formato sugerido: Base de datos
accedida por todo el equipo, así como almacenada en formato de archivo
sus tutores y profesor. Evitar utilizar datos plano (xls, csv, txt)
sensibles.
3era PRÁCTICA HACIA EL PROYECTO FINAL
Definición de la fuente de información
Recomendaciones:
✓ Una forma correcta de seleccionar un set de datos es pensar en alguna
iniciativa o proyecto personal, laboral o de estudio en el que necesites
analizar datos y medir información relevante. Por ejemplo, la información
recolectada para un proyecto de tesis, o el histórico de ventas versus el
presupuesto de un emprendimiento.
✓ Lo ideal es que los archivos que serán su fuente de información estén
relacionados con las temáticas definidas en la clase uno, pero no es
obligatorio. En esta instancia los cambios de temáticas aún son
bienvenidos.
3era PRÁCTICA HACIA EL PROYECTO FINAL
Definición de la fuente de información
Ejemplos:
Si no cuentan con un set de datos, propio o conocido, aquí hay algunas bases de datos
públicas:
✓ https://www.ncdc.noaa.gov/cdo-web/datatools/lcd
✓ https://data.buenosaires.gob.ar/dataset/estaciones-bicicletas-publicas
✓ https://data.worldbank.org/
✓ https://www.imf.org/en/Data
✓ http://data.europa.eu/euodp/en/data/
✓ https://trends.google.com/trends/?q=google&ctab=0&geo=all&date=all&sort=0
✓ https://www.aeaweb.org/resources/data/us-macro-regional
✓ https://www.kaggle.com/datasets
3era PRÁCTICA HACIA EL PROYECTO FINAL
Definición de la fuente de información
Ejemplo:
#Codertraining
¡No dejes para mañana lo que puedes practicar hoy!
Te invitamos a revisar la Guía de Ejercicios Complementarios, donde
encontrarás un ejercicio para poner en práctica lo visto en la clase de hoy.
Primera pre-entrega
En la clase que viene se presentará la consigna de la primera parte
del Proyecto final, que nuclea temas vistos entre las clases 1 y 3.
Recuerda que tendrás 7 días para subirla en la plataforma.
¡Atención!
Para la próxima clase deberás tener instalada la aplicación
Microsoft SQL Server Express.
En la carpeta de la comisión encontrarás un instructivo de
instalación.
Encuesta
sobre esta clase
Por encuestas de Zoom
¡Terminamos el módulo N° 1: Introducción a Data
Analytics!
Cuéntanos qué temas te resultaron más complejos de
entender. Puedes elegir más de uno. Vamos a retomar
aquellos temas que resultaron de mayor dificultad en el
próximo AfterClass.
¿Quieres saber más?
Te dejamos material
ampliado de la clase
MATERIAL AMPLIADO
Recursos multimedia
Título
✓ Youtube : Historia de las bases de datos | CodeTuts
✓ Artículo & E-book: ¿Que es un Data Warehouse? | IBM
Disponible en nuestro repositorio.
Resumen
de la clase hoy
✓ Resumen de lo visto en clase hoy:
✓ Bases de datos.
✓ Tipos de modelos de datos.
✓ Modelado de datos.
¿Preguntas?
Opina y valora
esta clase
#DemocratizandoLaEducación
Muchas gracias.