Malla académica
Análisis de datos en Python Profesor: Alejandro Cataldo, Ph.D Pontificia Universidad Católica de Chile
Alejandro Cataldo, Ph.D Pontificia Universidad Católica de Chile
Plan de estudios
Sobre el curso
Este curso busca que los estudiantes logren comprender cómo el uso adecuado y eficiente de Python como herramienta computacional para el análisis de datos puede mejorar su toma de decisiones dentro de su organización. Para ello, se introducirán los conceptos básicos y generales del análisis de datos, se revisará la importancia de visualizar e identificar valor en los datos y cómo los distintos métodos descriptivos, predictivos y prescriptivos permiten evidenciar oportunidades y justificar decisiones. Para ejemplificar estos conceptos y su desarrollo a través de Python, se verán casos prácticos en industrias diversas.
Contenidos
Ciencia de Datos y Python
- Conceptos fundamentales de la ciencia de datos
- Fundamentos de Python
Manejo de Base de Datos y manejo de los datos
- Tratamiento y limpieza de datos y análisis de datos masivos
Visualización avanzada de Datos
- Gráficos
- Interfaces
Analítica de datos
- Análisis descriptivo
- Análisis predictivo
- Análisis prescriptivo
La Pontificia Universidad Católica de Chile se reserva el derecho a modificar el contenido en cualquier momento.
Introducción a la ciencia de datos Profesor: Paula Aguirre, Doctora Pontificia Universidad Católica de Chile
Paula Aguirre, Doctora Pontificia Universidad Católica de Chile
Plan de estudios
Sobre el curso
Este curso introduce a los estudiantes al campo de la ciencia de datos a través de sus principios básicos y las principales técnicas y herramientas utilizadas. Los estudiantes aprenderán sobre recolección e integración de datos, análisis exploratorio de datos, análisis descriptivo y predictivo, y creación de productos de información. Los temas serán tratados en amplitud, más que en profundidad, haciendo énfasis en la integración y síntesis de conceptos, y evaluados en la aplicación a soluciones de problemas contextualizados.
Introducción a Ciencia de Datos y aprendizaje de máquinas
- ¿Qué es la ciencia de datos? Usos y aplicaciones
- El proceso de ciencia de datos
- Herramientas de Python para ciencia de datos
Obtención y transformación de datos
- Tipos y formatos de datos
- Fuentes y métodos de extracción de datos
- Limpieza e integración de conjuntos de datos
Análisis Exploratorio de Datos
- Estadísticas descriptivas
- Análisis gráfico univariado
- Análisis gráfico multivariado
Algoritmos básicos para análisis predictivo
- Introducción a aprendizaje de máquinas: tipos de aprendizaje y algoritmos básicos
- Algoritmos de aprendizaje supervisado
- Algoritmos de aprendizaje no supervisado
- Resumen y comunicación de resultados
La Pontificia Universidad Católica de Chile se reserva el derecho a modificar el contenido en cualquier momento.
Visualización de datos Profesor: Denis Parra, Ph.D University of Pittsburgh (EE.UU.)
Denis Parra, Ph.D University of Pittsburgh (EE.UU.)
Plan de estudios
Sobre el curso
En este curso los estudiantes obtendrán conocimientos y habilidades para resumir y comunicar resultados de métodos de computación, estadística, minería y análisis de datos. Dentro de las actividades prácticas del curso, los estudiantes estudiarán técnicas y algoritmos para analizar, diseñar y crear visualizaciones efectivas, basadas en principios de diseño gráfico, artes visuales y psicología cognitiva. El curso está orientado a estudiantes con experiencia previa en programación.
Contenidos
Fundamentos
- Definiciones y ejemplos históricos
- Marcas, canales, y procesamiento humano de la información
- Modelo anidado de Munzner para diseño y validación de visualización
- Reglas y recomendaciones generales para visualizaciones efectivas
Gráficos básicos en Python para datos tabulares
- Gráficos de barras, barras apiladas, puntos y líneas
- Gráficos de dispersión, de burbujas y de flujos
- Gráficos para distribuciones: histograma, densidad, caja y violín
- Múltiples ejes, radial y torta
Gráficos avanzados en Python para datos tabulares
- Mapa de calor, densidad 2D, treemap
- Matriz de gráficos y pequeños múltiples
- Reducción de dimensionalidad lineal
- Reducción de dimensionalidad no lineal
Implementación de gráficos en Python con datos de red, texto y espaciales
- Grafos y árboles: diagramas nodo-enlace y de adyacencia
- Grafos y árboles II: gráficos tipo encierro, clustermap y dendograma
- Visualización de texto
- Visualización espaciotemporal
La Pontificia Universidad Católica de Chile se reserva el derecho a modificar el contenido en cualquier momento.
Aprendizaje estadístico y computacional Profesor: Jonathan Acosta, Doctor USM-PUCV-UV (Chile)
Jonathan Acosta, Doctor USM-PUCV-UV (Chile)
Plan de estudios
Sobre el curso
En este curso los estudiantes aprenderán los conceptos elementales de machine learning y varias metodologías de aprendizaje supervisado y no supervisado. El estudiante deberá ser capaz de identificar los métodos más apropiados, aplicarlos y compararlos en diferentes contextos, en particular, para problemas de grandes volúmenes de datos.
Introducción a Machine Learning
- Tipos de aprendizaje
- Modelos de regresión lineal y logística
- Etapas del modelamiento en machine learning
Aprendizaje Supervisado
- Árboles de decisión
- Bosque aleatorio
- Clasificador bayesiano ingenuo
- K-vecinos más cercanos (KNN)
- Máquinas de vectores de soporte (SVM)
Aprendizaje No Supervisado
- Análisis de componentes principales (PCA)
- K-medias
- Agrupación jerárquica
La Pontificia Universidad Católica de Chile se reserva el derecho a modificar el contenido en cualquier momento.
Profesores
Alejandro Cataldo
Ph.D Pontificia Universidad Católica de Chile
Alejandro Cataldo es Ph.D en Ciencias de la Ingeniería, Pontificia Universidad Católica de Chile (UC), 2018.
Académico de la Escuela de Ingeniería y del Instituto de Ingeniería Matemática y Computacional de la UC.
Asimismo, se ha especializado en herramientas analíticas y matemáticas para apoyar procesos de toma de decisiones en sistemas complejos.
Además, en el sector público, ha sido consultor para el Ministerio de Salud y de Educación, Corfo, Junaeb y municipalidades; en el sector privado, empresas de minería, forestales, agroindustriales, cadenas de supermercados, farmacias, veterinarias y el sector bancario.
Cuenta con más de 13 publicaciones científicas de alto impacto en investigación de operaciones.
Denis Parra
Ph.D University of Pittsburgh (EE.UU.)
Denis Parra es Ph.D. en Philosophy in Information Science, University of Pittsburgh, Estados Unidos.
Profesor del Departamento de Ciencia de la Computación de Ingeniería de la Pontificia Universidad Católica de Chile (UC).
Además, realiza investigación y desarrollo de sistemas sociotécnicos, desde diversas perspectivas.
Entre sus áreas de interés se encuentran los sistemas recomendadores y el uso de visualizaciones tanto para crear aplicaciones como para analizar los datos.
Jonathan Acosta
Doctor USM-PUCV-UV (Chile)
Jonathan Acosta tiene un Doctorado en Matemática, consorcio Universidad Técnica Federico Santa María (USM), Pontificia Universidad Católica de Valparaíso (PUCV) y Universidad de Valparaíso (UV).
También es ingeniero civil matemático con mención en Estadística Aplicada y licenciado en Ciencias de la Ingeniería Matemática, ambos de la Universidad Técnica Federico Santa María (USM).
Asimismo, Jonathan Acosta dicta el curso Aprendizaje estadístico y computacional del Magíster en Ciencia de Datos de UC Chile (online).
Además, sus líneas de investigación corresponden a:
- modelamiento de datos dependientes
- estadística computacional y extracción de conocimiento desde bases de datos no estructuradas
- modelación estadística para aplicaciones multidisciplinarias
Paula Aguirre
Doctora Pontificia Universidad Católica de Chile
Paula Aguirre es doctora en Astrofísica, Pontificia Universidad Católica de Chile (UC), 2012. Asimismo es ingeniera civil mecánica y licenciada en Astronomía de la UC.
Es profesora asistente del Instituto de Ingeniería Matemática y Computacional UC. También, investigadora del Centro Nacional de Investigación para la Gestión Integrada de Desastres Naturales (Cigiden).