MDS3020 Introducción a la Ciencia de Datos
Escuela | Ing Matemática Y Computacional |
Área | |
Categorías | |
Créditos | 5 |
Prerequisitos
Requisitos: INF3103
Relación entre requisitos y restricciones: o
Restricciones: (Programa=Mg Ciencia de Datos) o (Programa=Mg Analiti Negocios)
Calificaciones
Este ramo no ha sido calificado.
CURSO:INTRODUCCION A LA CIENCIA DE DATOS
TRADUCCION:INTRODUCTION TO DATA SCIENCE
SIGLA:MDS3020
CREDITOS:05 UC
HORAS:90 HORAS DE DEDICACION TOTAL: 24 DIRECTAS Y 66 INDIRECTAS (2 MODULOS)
CARACTER:MINIMO
TIPO:CATEDRA,LABORATORIO
CALIFICACION:ESTANDAR
PALABRAS CLAVE:COMPUTACION, INTELIGENCIA, ARTIFICIAL, CIENCIA, DATOS, INTRODUCCION, DATA, SCIENCE
NIVEL FORMATIVO:MAGISTER
I.DESCRIPCIÓN DEL CURSO
Este curso introduce a los estudiantes al campo de la ciencia de datos a traves de sus principios basicos y las principales tecnicas y herramientas utilizadas. Los estudiantes aprenderan sobre recoleccion e integracion de datos, analisis exploratorio de datos, analisis descriptivo y predictivo, y creacion de productos de informacion. Los temas seran tratados en amplitud, mas que en profundidad, haciendo enfasis en la integracion y sintesis de conceptos, y evaluados en la aplicacion a soluciones de problemas contextualizados.
II.RESULTADOS DE APRENDIZAJE
1.Describir lo que es ciencia de datos: sus procesos, aplicaciones y relevancia para distintos tipos de organizaciones.
2.Implementar procesos simples de extraccion, limpieza e integracion de datos de diversas fuentes en lenguaje Python.
3.Explicar la importancia del analisis exploratorio de datos en ciencia de datos y aplicar sus metodos estadisticos y graficos a un estudio de caso.
4.Aplicar algoritmos basicos de aprendizaje de maquina para el analisis descriptivo y predictivo.
5.Analizar la importancia de una visualizacion y comunicacion efectiva de los datos.
III.CONTENIDOS
1.Introduccion a Ciencia de Datos y aprendizaje de maquinas.
1.1.?Que es la ciencia de datos? Usos y aplicaciones.
1.2.El proceso de ciencia de datos.
1.3.Herramientas de Python para ciencia de datos.
2.Obtencion y transformacion de datos.
2.1.Tipos y formatos de datos.
2.2.Fuentes y metodos de extraccion de datos.
2.3.Limpieza e integracion de conjuntos de datos.
3.Analisis Exploratorio de Datos.
3.1.Estadisticas descriptivas.
3.2.Analisis grafico univariado.
3.3.Analisis grafico multivariado.
4.Algoritmos basicos para analisis predictivo.
4.1.Introduccion a aprendizaje de maquinas: tipos de aprendizaje y algoritmos basicos.
4.2.Algoritmos de aprendizaje supervisado.
4.3.Algoritmos de aprendizaje no supervisado.
4.4.Resumen y comunicacion de resultados.
IV.ESTRATEGIAS METODOLOGICAS
-Clases expositivas en video.
-Cuadernos virtuales de programacion (Jupyter Notebooks).
-Exposicion y analisis de casos.
-Lecturas y reflexion individual.
-Cuestionarios en linea.
V.ESTRATEGIAS EVALUATIVAS
-Tareas: 60%
-Proyecto grupal: 20%
-Foro de discusion: 20%
-El curso contendra ademas actividades formativas (sin calificacion), las que tienen como proposito la preparacion para las evaluaciones calificadas.
VI.BIBLIOGRAFIA
Minima
Wes McKinney.?Python for data analysis: Data wrangling with Pandas, NumPy,and IPython?.O'Reilly Media,2017.
Pedregosa, F.,Michel, V.,Varoquaux, G.,et al.?Scikit-learn: Machine Learning in Python?,Journal of Machine Learning Research,12(85):2825?2830,2011.
Complementaria
Grus,Joel.?Data Science from Scratch?.O'Reilly Media.2019.
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
INSTITUTO DE INGENIERIA Y MATEMATICA Y COMPUTACIONAL / MARZO 2022
Secciones
Sección 1 | Paula Aguirre |