MDS3020 Introducción a la Ciencia de Datos

EscuelaIng Matemática Y Computacional
Área
Categorías
Créditos5

Prerequisitos

Requisitos: INF3103
Relación entre requisitos y restricciones: o
Restricciones: (Programa=Mg Ciencia de Datos) o (Programa=Mg Analiti Negocios)

Calificaciones

Este ramo no ha sido calificado.

No hay comentarios.

CURSO:INTRODUCCION A LA CIENCIA DE DATOS
TRADUCCION:INTRODUCTION TO DATA SCIENCE
SIGLA:MDS3020
CREDITOS:05 UC
HORAS:90 HORAS DE DEDICACION TOTAL: 24 DIRECTAS Y 66 INDIRECTAS (2 MODULOS)
CARACTER:MINIMO
TIPO:CATEDRA,LABORATORIO
CALIFICACION:ESTANDAR
PALABRAS CLAVE:COMPUTACION, INTELIGENCIA, ARTIFICIAL, CIENCIA, DATOS, INTRODUCCION, DATA, SCIENCE
NIVEL FORMATIVO:MAGISTER


I.DESCRIPCIÓN DEL CURSO

Este curso introduce a los estudiantes al campo de la ciencia de datos a traves de sus principios basicos y las principales tecnicas y herramientas utilizadas. Los estudiantes aprenderan sobre recoleccion e integracion de datos, analisis exploratorio de datos, analisis descriptivo y predictivo, y creacion de productos de informacion. Los temas seran tratados en amplitud, mas que en profundidad, haciendo enfasis en la integracion y sintesis de conceptos, y evaluados en la aplicacion a soluciones de problemas contextualizados.


II.RESULTADOS DE APRENDIZAJE

1.Describir lo que es ciencia de datos: sus procesos, aplicaciones y relevancia para distintos tipos de organizaciones.

2.Implementar procesos simples de extraccion, limpieza e integracion de datos de diversas fuentes en lenguaje Python.

3.Explicar la importancia del analisis exploratorio de datos en ciencia de datos y aplicar sus metodos estadisticos y graficos a un estudio de caso.

4.Aplicar algoritmos basicos de aprendizaje de maquina para el analisis descriptivo y predictivo.

5.Analizar la importancia de una visualizacion y comunicacion efectiva de los datos.


III.CONTENIDOS

1.Introduccion a Ciencia de Datos y aprendizaje de maquinas.
1.1.?Que es la ciencia de datos? Usos y aplicaciones.
1.2.El proceso de ciencia de datos.
1.3.Herramientas de Python para ciencia de datos.

2.Obtencion y transformacion de datos.
2.1.Tipos y formatos de datos.
2.2.Fuentes y metodos de extraccion de datos.
2.3.Limpieza e integracion de conjuntos de datos.

3.Analisis Exploratorio de Datos.
3.1.Estadisticas descriptivas.
3.2.Analisis grafico univariado.
3.3.Analisis grafico multivariado.

4.Algoritmos basicos para analisis predictivo.
4.1.Introduccion a aprendizaje de maquinas: tipos de aprendizaje y algoritmos basicos.
4.2.Algoritmos de aprendizaje supervisado.
4.3.Algoritmos de aprendizaje no supervisado.
4.4.Resumen y comunicacion de resultados.


IV.ESTRATEGIAS METODOLOGICAS

-Clases expositivas en video.

-Cuadernos virtuales de programacion (Jupyter Notebooks).

-Exposicion y analisis de casos.

-Lecturas y reflexion individual.

-Cuestionarios en linea.


V.ESTRATEGIAS EVALUATIVAS

-Tareas: 60%

-Proyecto grupal: 20%

-Foro de discusion: 20%

-El curso contendra ademas actividades formativas (sin calificacion), las que tienen como proposito la preparacion para las evaluaciones calificadas.


VI.BIBLIOGRAFIA

Minima

Wes McKinney.?Python for data analysis: Data wrangling with Pandas, NumPy,and IPython?.O'Reilly Media,2017.

Pedregosa, F.,Michel, V.,Varoquaux, G.,et al.?Scikit-learn: Machine Learning in Python?,Journal of Machine Learning Research,12(85):2825?2830,2011.


Complementaria

Grus,Joel.?Data Science from Scratch?.O'Reilly Media.2019.


PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
INSTITUTO DE INGENIERIA Y MATEMATICA Y COMPUTACIONAL / MARZO 2022


Secciones

Sección 1 Paula Aguirre