Cursos de Data Science Online Cooperación Clases abiertas
FAQ Nosotros Acceso Alumnos
DIPLOMATURA EN CIENCIA DE DATOS
CON R Y PYTHON
Certificado en Data Science
con R y Python
✔ La calidad académica de la Diplomatura en Ciencia de Datos con R y Python ha sido avalada
por la Resolución Nro 290/20 de la Universidad Tecnológica Nacional UTN FRRQ.
Duración: 25 semanas – 3 clases en vivo por semana – Carga horaria: 250 Horas.
$75.000,00 $59.000,00 INSCRIBIRME AHORA
La diplomatura en Ciencia de Datos con R y Python incluye un curso gratis de nivelación de
p y y y g
contenidos para aquellos estudiantes sin experiencia previa.
Proyectos a realizar – Fechas de Inicio – Plan de Estudio – Formas de pago – Equipo Docente
¿Qué vas a aprender con nuestro
Certificado en Ciencia de datos con
R y Python?
Aprenderás los principales algoritmos de aprendizaje supervisado y no supervisado. Entre los
algoritmos supervisados verás árboles de decisión, redes neuronales, reglas de asociación, bayes
ingenuo, bosques aleatorios. Y no supervisado como agrupamiento.
Descubrirás además cómo usar series las temporales, el método de Montecarlo, los algoritmos
genéticos, y las técnicas de regresión, minería de textos y Big Data. Estas aplicaciones podrás
utilizarlas en múltiples campos. Como negocios, salud, recursos humanos, cobranzas, finanzas,
publicidad, marketing, procesos de servicios y de producción, urbanismo, políticas públicas, etc.
✔ Clases en vivo
Todas las clases en vivo quedan grabadas a disposición de los estudiantes y no se exige
asistencia. También dispones de clases de ediciones anteriores.
✔ Aprende haciendo
Un fuerte componente práctico orientado a proyectos para que aprendas haciendo Al final
Un fuerte componente práctico orientado a proyectos para que aprendas haciendo. Al final
de la cursada presentas tu propio proyecto.
✔ Consultas online
Participa en el grupo de WhatsApp para realizar tus consultas fuera del horario de clases. Se
coordinan videollamadas para atender consultas especificas.
· · ·
¿Qué proyectos realizaremos durante la
cursada?
Selección de prospectos
Aprenderás a seleccionar los prospectos de venta que tengan la máxima rentabilidad o
máxima ganancia.
Predicciones de ventas
Como hacer predicciones de venta para el futuro.
Selección de personal
Cómo hacerlo a partir de una encuesta de características de personalidad y datos
sociodemográficos de las personas.
Cartera de Acciones
Distribuir la cartera de acciones de manera de maximizar la rentabilidad y minimizar la
variabilidad.
Optimización de Cajas
Cómo optimizamos la cantidad de cajas que tiene que haber en un supermercado para
controlar la demora.
Muchos más proyectos
Durante tu cursada seguirás viendo más proyectos y también los docentes te ayudaran en
tu propio proyecto final.
· · ·
Fechas de inicio de la diplomatura en Ciencia
de Datos con R y Python para nuevos
estudiantes
Lunes 13 de Diciembre 2021
Últimas vacantes
Lunes 27 de Diciembre 2021
14 vacantes disponibles
· · ·
Promociones y formas de pago para
acceder a la diplomatura
En Argentina puedes abonar en 6 cuotas sin interés con tarjeta de crédito.
También puedes abonar tu diplomatura en un pago por Transferencia Bancaria, Rapipago, PagoFácil
o Tarjeta de Debito.
$75.000,00 $59.000,00 INSCRIBIRME AHORA
El valor de la diplomatura abonando desde el exterior de Argentina es de $649 Dólares. Consulta con
nuestros asesores las formas de pago disponibles en tu país.
· · ·
Plan de estudios de la Diplomatura en
Ciencia de Datos con R y Python
Definiciones de Ciencia de Datos
Introducción a la Ciencia de Datos
Niveles a los que opera la ciencia de datos
Introducción a Data Warehouse
Introducción a Data Mining
Introducción a Knowledge Discovery
Introducción a Herramientas OLAP y Tableros de comando
Repaso de herramientas disponibles
Taxonomía de las competencias de un científico de datos
Primeros pasos en R
Instalando y cargando paquetes en R
Introducción a R
Variables, vectores y matrices
Dataframes
Paquetes y librerías
Manejo de archivos csv
Conversiones de tipos
Conexión a bases de datos
Ejecución condicional
Bucles
Funciones en R
Medidas estadísticas
Correlaciones
Funciones estadísticas
Introducción a Python
Descarga e instalación
Principales librerías
Variables y tipos de datos
Listas, tuplas y diccionarios
Ejecución condicional
Ciclos definidos e indefinidos
Manejo de Excepciones
Funciones y Generadores
Clases y objetos
Manejo de archivos y directorios
Conexión a archivos planos
Conexión a Excel
Conexión a Bases de Datos
Tests básicos
Repaso de conceptos de probabilidad y estadística
Test de Hipótesis
Correlaciones
AB Test
Cálculo de correlaciones en R con cor
Funciones de distribución en R
Histogramas en R
Gráficos de líneas en R
Gráficos de áreas en R
Uso de NumPy
Uso de Pandas
Uso de MatPlotLib
Módulo matplotlib
Módulo math
Módulo numpy
Módulo yt
Módulo mayavi
Regresiones
Regresión Lineal
Regresión polinómica
Regresión exponencial y logarítmica
Regresión de dos variables
Cálculo de regresiones en R con lm
Cálculo de regresiones logísticas en R con glm
Regresiones en Python
Regresión logística en Python
Arboles de decisión
Algoritmo básico en Excel
División en entrenamiento y prueba
Uso de Rpart y cp
Predicción y valoración de la solución
Uso de Party
Aplicación al problema del call center
Instalación y uso del paquete en Python
Ejemplo en Python
Principales parámetros de ajuste y control
Clusters
Algoritmo básico en Excel
Uso de kmeans en R
Ejemplo de aplicación real en R
Otros algoritmos de agrupamiento en R
Ejercicio de aplicación de agrupamiento de mascotas
Uso de Scikit-Learn en Python
Análisis de componentes principales en Python
K-Medias en Python
Clustering jerárquico en Python
Reglas de Asociación
Algoritmo básico en Access
División en entrenamiento y prueba en R
Uso de arules en R
Ejemplo de una aplicación real votación de reglas en R
Ejemplo de una aplicación real a datos de ventas en supermercados en R
Instalación y uso del paquete en Python
Ejemplo en Python
Principales parámetros de ajuste y control
Esquema de votación de reglas en Python
Redes Neuronales
Algoritmo básico en Excel
División en entrenamiento y prueba en R
Uso de neuralnet
Predicción y valoración de la solución en R
Discusión del problema de legibilidad de los resultados desde el negocio
Competencia entre árboles y redes en un caso concreto en R
Instalación y uso del paquete en Python
Ejemplo en Python
Principales parámetros de ajuste y control en Python
Problema concreto en Python
Algoritmos genéticos
Algoritmo básico en Excel
Discusión del tipo de problemas en los que se aplica
Discusión de otros mecanismos de optimización
Implementación en R del uso de algoritmos genéticos como Valores reales
Binarios
Permutaciones
Implementación en Python
Series temporales
Taxonomía
Separación de componentes
Predicciones
ARIMA implementado en R
Predicción en series con un único período
Predicción en series con múltiples períodos
Predicción en series con períodos variables: renormalización
Implementación en Python
Método de Simulación de Montecarlo
Algoritmo básico en Excel
Discusión de la utilidad del método
Comparación con el análisis de escenarios
Ejemplo de una aplicación real
Ejemplo simple implementado en R
Ejemplo simple implementación en Python
Minería de textos
Clasificación supervisada de piezas de texto
Construcción de una red semántica
Discusión de las posibilidades de reconocimiento de voz
Ejemplos de aplicación real del algoritmo de clasificación
Aplicación a la detección de sentimientos
Ejemplo de implementación en Python
Vecinos Cercanos (Knn)
Instalación y uso del paquete en R
Ejemplo conceptual en Excel
Ejemplo en R
Instalación y uso del paquete en Python
Ejemplo en Python
Principales parámetros de ajuste y control
Bayes Ingenuo
Implementación en Excel
Ejemplo de aplicación en R
Comparación de 4 algoritmos predictivos (Bayes ingenuo, árboles, redes neuronales y
regression logística)
Ejemplo de aplicación en Python
Random Forest
Bootstrap y bagging
Descripción conceptual del método random forest
Paquete randomForest para R
Ejemplo de aplicación
Comparación con otras técnicas
Implementación en Python
Métodos bayesianos avanzados
Descripción conceptual del método:
Regresión lineal bayesiana
Regresión logística bayesiana
Inferencia bayesiana
Red bayesiana
Ejemplos de aplicación en RPaquete BAS
Paquete brms
Paquete arm
Paquete bnlearnd
Comparación con otras técnicas
Ejemplos de aplicación en Python
Máquina de soporte vectorial
Descripción conceptual del método
Paquete e1071 para R
Ejemplo de aplicación en R
Ejemplo de aplicación en Python
Comparación con otras técnicas
Discriminante lineal y cuadrático
Instalación y uso del paquete
Ejemplo conceptual en Excel
Ejemplo en R
Ejemplo en Python
Principales parámetros de ajuste y control en R
Principales parámetros de ajuste y control en Python
Problema concreto
Análisis de Fourier
Descripción conceptual
Ejemplo conceptual en Excel
Instalación y uso del paquete en R
Instalación y uso del paquete en Python
Ejemplo en R
Ejemplo en Python
Herramientas geográficas
Distancias
Implementación en RPaquete sf
Paquete nngeo
Aplicación práctica en R
Implementación en Python
Aplicación práctica en Python
Bases de datos documentales
Instalación de MongoDB
Conexión a R
Conexión a Python
Aplicación práctica en R
Aplicación práctica en Python
Diseño de Datawarehouses
Diferencias entre los DW y los OLTP
Tipos de datos y soportes
Dimensiones y jerarquías
Estimación de recursos y tiempos según tipos de datos
Ejemplos de staging
Interacción entre equipos (DB-ETL-Soporte-FrontEnd-Usuarios)
Ejercicios de diseño de DW
Diseño y construcción de ETL
Procesos ETL: generalidades, buenas prácticas, esquemas de ETL
Detalles de cada etapa: extracción, limpieza, normalización, transformación, carga
Estrategias de update
Ejercicios de diseño de ETL para la carga inicial
Ejercicios de diseño de ETL para la actualización
Licencia, descarga e instalación de Open Refine
Uso general como herramienta de limpieza de datos
Pre-procesado de los datos
Casos de interés y ejemplos
Licencias, descarga e instalación de Pentaho-Kettle
Pentaho Kettle: funciones, características, utilización
Auditoría y documentación
Ejemplos de uso
Big Data
¿Qué es Big Data?
¿Cuándo usar Big Data?
¿Cómo armar una infraestructura para Hadoop?
Ejemplo de una aplicación de Map Reduce: wordcount
Como evitar Hadoop
Aprende DATA SCIENCE a distancia. DIPLOMATURA en CIENCIA DE DATOS co…
co…
La duración de cada clase es de 30 a 60 minutos dependiendo del tema, la cantidad de participantes
y el nivel de intervenciones conseguido. El estudiante tiene actividad complementaria con material de
soporte de las clases, material teórico para estudiar, ejercicios resueltos y para resolver. Se
realizan corrección de ejercicios y autoevaluaciones. Los grupos de participantes son reducidos y
de varios países hispanoparlantes. Lo que aporta diferentes visiones y la posibilidad de networking
internacional. Soporte docente por Grupo de WhatsApp, email y foro.
Que los alumnos
Entiendan los conceptos del campo
Manejen los principales algoritmos para crear modelos predictivos
Utilicen las herramientas de aprendizaje no supervisado
Sepan medir con criterio del negocio los resultados de sus modelos
Participen de las experiencias aportadas por los instructores
Horarios de la Cursada (GTM-3) de la
Diplomatura en Ciencia de Datos con R y
Python
Diplomatura en Ciencia de Datos con R y Python Día Hora
Introducción a la Ciencia de Datos 13/12/2021 19 hs
Introducción a la Ciencia de Datos 16/12/2021 19 hs
Iniciación en R 1 de 2 20/12/2021 19 hs
Iniciación en R 2 de 2 23/12/2021 19 hs
Iniciación en Python 1 de 4 15/12/2021 19 hs
Iniciación en Python 2 de 4 17/12/2021 19hs
Iniciación en Python 3 de 4 22/12/2021 19 hs
Iniciación en Python 4 de 4 24/12/2021 19 hs
Horarios fijos a partir de la tercer semana de cursada
Clases teóricas – prácticas regulares de Python Martes 19 hs
Clases teóricas regulares R Lunes 20:15 hs
Clases prácticas regulares R Jueves 20:15 hs
Instancias de evaluación
Examen final de la diplomatura (Mínimo 60 % de respuestas correctas).
Presentación de proyecto final.
Autoevaluación recursos de nivelación positiva (opcional).
.
· · ·
Equipo docente de la Diplomatura en
Ciencia de Datos con R y Python
IGNACIO URTEAGA LAURA SIRI
SUSANA SARMIENTO GUILLERMO GAROFALO
VISITA NUESTRAS REDES
CONTACTANOS AHORA
info@institutodatascience.org
Teléfono: +54 9 11 39148021
INFORMACIÓN INSTITUCIONAL
Instituto Data Science SA
CUIT: 30 71719900 2
Adm. Académica: Riobamba 1059 C1116ABE
Domicilio Legal: Uriburu 660 P 2 C1027AAN
Buenos Aires - Argentina
Política de Privacidad
© 2021 Instituto Data Science Argentina