[go: up one dir, main page]

100% encontró este documento útil (1 voto)
66 vistas112 páginas

Diap Data Slides

Este documento describe los conceptos de data science, inteligencia artificial y big data. Explica que la data science es el proceso de extraer información valiosa de los datos mediante la obtención, limpieza, exploración, análisis y visualización de datos, así como el uso de modelos de machine learning. La inteligencia artificial se refiere a algoritmos que emulan la inteligencia humana para reconocer patrones. El big data se refiere a grandes volúmenes y variedades de datos que son difíciles de procesar con métodos tradicionales.

Cargado por

vgmaluzan73.0307
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
66 vistas112 páginas

Diap Data Slides

Este documento describe los conceptos de data science, inteligencia artificial y big data. Explica que la data science es el proceso de extraer información valiosa de los datos mediante la obtención, limpieza, exploración, análisis y visualización de datos, así como el uso de modelos de machine learning. La inteligencia artificial se refiere a algoritmos que emulan la inteligencia humana para reconocer patrones. El big data se refiere a grandes volúmenes y variedades de datos que son difíciles de procesar con métodos tradicionales.

Cargado por

vgmaluzan73.0307
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 112

Cómo y por qué

Aprender Data
Science e
Inteligencia
Artificial
Oportunidades
laborales en Data
Science e Inteligencia
Artificial
¿Qué es data science?
¿Qué es data
science?

Data science o ciencia de


datos es el proceso de
descubrir información valiosa
de los datos.
¿Cuál es su
finalidad?
● Tomar decisiones y crear
estrategias de negocio.

● Crear productos de software más


inteligentes y funcionales.

¿De qué trata este proceso?


● Obtención de los datos.
● Transformar y limpiar los datos.
● Explorar, analizar y visualizar datos.
● Usar modelos de machine learning*.
● Integrar datos e IA a productos de software.

*Inteligencia artificial. No siempre es necesario usarla.

Proceso de la
ciencia de datos Hacer una pregunta
interesante

● El proceso entre proyecto a


Obtener los datos
proyecto cambia poco.

● Es el proceso del método Explorar los datos


científico llevado al uso de
datos.
Analizar los datos

Comunicar y
Proceso de la ciencia de datos
Hacer una pregunta
interesante

Obtener los
datos

Explorar los
datos

Analizar los
datos

Comunicar y
visualizar resultados
¿Qué es inteligencia
artificial?
Inteligencia artificial
Inteligencia artificial
Inteligencia artificial

● Inteligencia artificial y data


science no son lo mismo.

¿Pero qué es en
realidad?
● Algoritmos para emular
nuestra inteligencia
natural.
● Reconocer patrones en
grandes cantidades de datos.

¿Pero qué es en realidad?


IA en la actualidad
Proceso de machine learning
Datos de
entrenamiento

Evaluar
Entrenar el
algoritmo de
ML

Modelo
Datos
de

Algoritmo Predicción entradade ML


Proceso de ciencia de datos:
integrar ML a producto
Ingesta de Validación de Preparación de Entrenamiento
datos datos datos de modelo

Evaluación de Validación de Despliegue de


modelo modelo modelo Interfaz de
usuario
¿Cuál es su diferencia
con data science?
Data science + IA
Data science Inteligencia artificial

Proceso para analizar datos y Algoritmos para predecir


generar predicciones para eventos futuros que emulan
toma de cognición.
decisiones y crear productos
con datos.

En el proceso de data science utilizamos inteligencia artificial


como una de sus herramientas.
¿Qué es Big Data?
Big Data

● Grandes volúmenes de datos muy


variados y muy veloces.

● Resulta complicado procesarlos


con métodos tradicionales.

5V de Big Data
5V de Big Definición
Data
Volumen El almacenamiento de la masiva cantidad de datos que pueden ser
recolectados de múltiples fuentes.

Velocidad Los datos se generan en tiempo real gracias a las interacciones con las fuentes
mencionadas, por lo que deben ser procesados con la misma velocidad.

Variedad Todo tipo de datos, ya sea estructurados o no estructurados. Podrían ser


tablas, texto, imágenes, videos, audio, bases de datos, etc.

Veracidad Es la calidad y confiabilidad de los datos.

Valor Los datos deben poder proporcionar un valor o beneficio a la empresa que los
está usando.
Procesamiento de Big Data

● Se procesa al dividirla en partes


pequeñas en varias máquinas.
● Tecnologías como Spark, Hadoop y
servicios de cómputo en la nube.
¿Cómo se une con
data science e IA?
Data science + IA + Big Data
Data science Inteligencia artificial Big Data

Proceso para analizar datos y Algoritmos para predecir Grandes volúmenes de datos
generar predicciones para eventos futuros que emulan muy variados, muy veloces y
toma de cognición. difíciles de procesar.
decisiones y crear productos
con datos.

● Big Data es materia prima que podemos usar en data science para hacer análisis más
exhaustivos.
● Incluso podemos utilizar machine learning en ese mismo proceso para perfeccionar y
evaluar los algoritmos de inteligencia artificial que creemos.
¿Qué NO es data
science y por qué
aprenderla?
¿Qué NO es data science?

● Magia.

● Inteligencia artificial.

● Tener solamente métricas de algún


dato sin hallazgos de valor.
¿Qué NO es data science?

● Puras matemáticas.
¿Por qué NO aprender
● Trabajar solo con Big Data.
¿Por qué no aprender
data science?
¿Por qué NO aprender
data science?
● No quieres que el aprendizaje sea
algo constante en tu vida.

● No disfrutas del “trabajo sucio”.


¿Por qué NO aprender
data science?
● No te gusta comunicar
y negociar lo que
logras/encuentras.
¿Por qué NO aprender
● No te sientes
motivado por ayudar a
otras personas.

data science?
● No te gusta “hacer que
las cosas pasen”.
¿Por qué sí aprender
data science?
¿Por qué aprender data
science?
● Te emociona encontrar información
de valor en datos/gráficas.

● Te interesa conocer cómo se aplican


las matemáticas y algoritmos.

¿Por qué aprender


data science?
● Quieres trabajar en una organización
data-driven y verla crecer.

● Quieres crear software/productos que


cambien al mundo con datos e IA.
Áreas de aplicaciónde
data science e IA
Ramas de IA
● Machine learning.
● Deep learning.
● RPA.
● Visión artificial.
● Procesamiento de lenguaje
natural.
● Robótica
Áreas de aplicación de
data science
● Salud
● Procesos productivos
● Procesos comerciales
● Redes sociales
Cómo funcionan los
equipos de datos e IA
Roles en la industria
Roles en la industria

● Data Scientist ● Data


Analyst
● Data Engineer
● Machine Learning
Engineer
Data science en las
empresas y sus equipos
La jerarquía de necesidades de data science
algoritmos simples ML
Agregaciones/
Etiquetado
Analytics, métricas,
segmentación, agregaciones,
características, entrenamiento
Exploración/
de datos
Limpieza, detección de anomalías,
preparación
Datos confiables, flujo, infraestructura, pipelines,
ETL, datos estructurados y no estructurados

Instrumentación, logging, sensores, datos


externos, contenido generado por el usuario

Transformación

Movimiento/
Almacenamiento

Recolección

Referencia: 2. Data Science Hierarchy of needs


(Monica Rogati — Hackernoon)
Data Research
analyst scientist
Business

ML
Developer
engineer

Data Data
Engineering
engineer scientist

Interfaz
de modelo Despliegue de
Ingesta Validación Preparación Entrenamiento Evaluación de modelode modeloValidación
modelo
usuariode
de datos de datos de datos

Pasos y roles en el flujo de trabajo de data science (Design


Patterns in Machine Learning).
¿Qué hace una
Data Scientist?
¿Qué hace una Data Scientist?

Datos Data ML Service


Scientist / Insights

¿Qué hace un Data Scientist?


Toma de decisiones Incorporar datos a los basadas
en datos. productos de software.
Día a día de Data Scientist

● Obtener, limpiar y procesar


datos.

● Diseñar y utilizar modelos de


machine learning.

Día a día de Data Scientist


● Monitorear la precisión de
los datos.

● Automatizar procesos de
recolección y transformación
de datos.
Día a día de Data Scientist

● Crear reportes de
información en tableros.

● Incorporar datos a los


productos.

Data Scientist vs. Data Analyst


Data Scientist Data Analyst

● Incorporar datos a los ● Se enfoca en responder


productos - ingeniería. preguntas del negocio.
● Programación avanzada ● Programación
con POO. fundamental.
● Machine learning y ● Analizar el presente de la
estadística avanzada. organización.
Herramientas y
tecnologías para
Data Scientists
Herramientas y tecnologías

● Programación con Python o R


(incluyendo POO).
● Jupyter Notebooks.
● Pandas, Numpy, Matplotlib.
Herramientas y tecnologías

● Algoritmos y librerías de
machine learning como scikit-
learn y TensorFlow.
● Bases de datos SQL y NoSQL.
Matemáticas para data
scientist
● Álgebra
● Estadística descriptiva e
inferencial
● Probabilidad
● Álgebra lineal
● Cálculo
¿Cómo empezar?
● Cómo utilizan los datos las
organizaciones.

● Programación con Python y sus


librerías para data science.

¿Cómo empezar?
● Usar Jupyter Notebooks.
● Estadística y probabilidad aplicada
a data science.

¿Cómo empezar?
Reto

Busca en sitios de trabajo


vacantes de Data Scientist.
La experiencia
de una Data
Scientist
¿Qué hace una
Data Analyst?
¿Qué hace una Data Analyst?

Datos Data Insights


Analyst
¿Qué hace un Data Analyst?
Extraer datos recolectados. Analizarlos y reportar
resultados.
Día a día de Data Analyst

● Identificar necesidades de
información.

● Extraer datos de fuentes con


SQL o Python.
Día a día de Data Analyst

● Limpiar y organizar los datos


para su análisis.

● Analizar los datos para


identificar patrones y
tendencias.
Día a día de Data Analyst

● Comunicar los hallazgos en


tableros o dashboards.
Flujo de trabajo de Data
Analyst
Recopilar
Problema o Exploración y
información de
pregunta queries
valor

Crear
Comunicar
visualizaciones de
hallazgos
la información
Roles relacionados

● Business Analyst

● Data visualization specialist


Herramientas y
tecnologías para
Data Analysts
Herramientas y tecnologías

● Consulta de bases datos con


SQL.
● Software de visualización de
datos como Power BI y
Tableau.
● Excel y Google Sheets.
● Programación con Python o R.
Herramientas y
tecnologías
● Jupyter Notebooks.
● Pandas, Matplotlib, Numpy.

Matemáticas para
Data Analyst
● Probabilidad
● Estadística descriptiva
¿Cómo empezar?
● Cómo utilizan los datos las
organizaciones con Business
Intelligence.
● Consultar bases de datos con SQL.
● Herramientas para análisis de datos
como Excel, Power BI y Tableau.
● Estadística aplicada a análisis de
datos.

¿Cómo empezar?
Reto

Busca en sitios de trabajo


vacantes de Data Analyst.
La experiencia de
un Data Analyst
con Demian Arenas
¿Qué hace una
Data Engineer?
¿Qué hace una Data Engineer?

Datos Data Datos


crudos Engineer limpios para
análisis
¿Qué hace un Data Engineer?

Trabaja para que el Crea pipelines ETL.


equipo tenga datos para
análisis.
Día a día de una Data Engineer

● Data pipelines de ETL y bases de


datos.

● Extraer datos de diferentes


fuentes.
Día a día de una Data Engineer

● Transformar los datos para


análisis.

● Bases de datos especializadas


para análisis.
Día a día de una Data Engineer

● Crear automatizaciones para ETL.


Proceso ETL
Extraer Transformar Cargar
(Load)

Archivos

Bases
de
datos
(OLTP)

Data
API Warehouse
(OLAP)
Roles relacionados

● Data Architect

● Big Data Architect


Herramientas y
tecnologías para
Data Engineers
Herramientas y tecnologías

● Programación con Python y


bases de ingeniería de software.
● Linux.
● Automatización y scripting.
Herramientas y tecnologías

● Jupyter Notebooks y editores de


código.
● Manejo avanzado de bases de
datos SQL y NoSQL.
● Pandas, Dask y Apache Spark.
Herramientas y tecnologías

● Airflow.
● Tecnologías cloud.
● Contenedores Docker.
● Orquestadores Kubernetes.
Matemáticas
para Data
Engineer
● Estadística descriptiva
¿Cómo empezar?
● Python y bases sólidas de
ingeniería de software.
● Automatización y scripting. ●
Pandas y Apache Spark.
● Bases de datos SQL y NoSQL.

¿Cómo empezar?
Reto

Busca en sitios de trabajo


vacantes de Data Engineers.
La experiencia de
un Data Engineer
¿Qué hace una
Machine Learning
Engineer?
¿Qué hace una ML Engineer?

Modelo
Data Scientist ML Engineer funcionando con modelo en
ML
producción
¿Qué hace una ML Engineer?

Crear productos Escalar modelos de IA. basados en


IA.
Día a día de ML Engineer

● Generar una evaluación extensiva de


métricas de modelos de machine
learning.

● Construir, escalar y robustecer


sistemas de machine learning que
funcionen en producción.
Día a día de ML Engineer

● Colaborar con Data Scientists y otras


áreas de ingeniería de software.

● Monitorear el desempeño y
funcionalidad de los sistemas de
machine learning.
Proceso de machine learning
Datos de
entrenamiento

Evaluar
Entrenar el
algoritmo
de ML

Modelo

Datos de Algoritmo Predicción entrada


de ML
Data Research
analyst scientist
Business

ML
Developer
engineer

Data Data
Engineering
engineer scientist

Interfaz
Ingesta Validación Preparación Entrenamiento Evaluación Validación Despliegue de
de datos de datos de datos de modelo de modelo de modelo de modelo
usuario

Pasos y roles en el flujo de trabajo de data science


(Design Patterns in Machine Learning).
Herramientas y
tecnologíaspara
Machine Learning
Engineers
Herramientas y tecnologías

● Programación avanzada con


Python, Java y C++.

● Bases sólidas de ingeniería de


software.

● Jupyter Notebooks.
Herramientas y tecnologías

● Pandas, Numpy, Matplotlib,


Seaborn.

● Uso extensivo de
frameworks y librerías de
machine learning.
Herramientas y tecnologías

● Flask o FastAPI
● Tecnologías cloud
● Contenedores Docker

● Kubernetes
Matemáticas para
machine learning

● Estadística descriptiva e
inferencial
● Probabilidad
● Álgebra lineal
● Cálculo
¿Cómo empezar?

● Programación con
Python y bases sólidas de ingeniería
de software.
● Uso de librerías de Python para
manipulación, análisis y
visualización de datos.

¿Cómo empezar?
● Matemáticas
aplicadas a data science e
inteligencia artificial.
● Aplicación de modelos de machine
learning con scikit-learn.

¿Cómo empezar?
Reto

Busca en sitios de trabajo vacantes de


ML Engineers.
La experiencia de un
Machine Learning
Engineer
Soft skills para
profesionales de
los datos e IA
En sus marcas,
listos, fuera

También podría gustarte