GEO5059 Introducción a la Ciencia de Datos Con R
Escuela | Geografía |
Área | |
Categorías | |
Créditos | 10 |
Prerequisitos
Sin requisitos
Restricciones: ((Nivel = Doctorado) o (Nivel = Magister))
Calificaciones
Este ramo no ha sido calificado.
CURSO:INTRODUCCION A LA CIENCIA DE DATOS CON R
TRADUCCION:INTRODUCTION TO DATA SCIENCE WITH R
SIGLA:GEO5059
CREDITOS:10
MODULOS:02
CARACTER:OPTATIVO
TIPO:LABORATORIO
CALIFICACION:ESTANDAR
PALABRAS CLAVE:DATA SCIENCE, R, PROGRAMACION, BASES DE DATOS
NIVEL FORMATIVO:MAGISTER
I.DESCRIPCIÓN DEL CURSO
En este curso las y los estudiantes desarrollaran habilidades de programacion basadas en el lenguaje R orientadas a la ciencia de datos. Mediante actividades de laboratorio, estudio de casos y aprendizaje basado en problemas se exploraran herramientas para transformar datos no procesados en conocimiento util, abordando tematicas urbanas, medioambientales y sociales. Las evaluaciones consideran la puesta en practica de los aprendizajes mediante la realizacion de ejercicios de programacion aplicados, controles y trabajos practicos.
II.RESULTADOS DE APRENDIZAJE
1.Crear scripts de codigo utilizando el lenguaje de programacion R.
2.Implementar el flujo de trabajo asociado a la ciencia de datos para el trabajo reproducible con datos tabulares.
3.Aplicar tecnicas para el procesamiento y manipulacion de datos para el trabajo con informacion no procesada.
III.CONTENIDOS
1.Fundamentos de programacion en R.
1.1.Familiarizacion con ambiente RStudio.
1.2.Objetos, vectores, funciones y paquetes.
1.3.Tipos y clases de datos.
2.Calidad de datos.
2.1.Fuente de errores y preprocesamiento de datos.
2.2.Estadisticos descriptivos de resumen.
2.3.Importacion y exportacion de datos.
3.Manipulacion y transformacion de datos.
3.1.Construccion de queries o consultas - operadores relacionales y booleanos (seleccion de filas).
3.2.Manejo columnas (seleccionar, renombrar, eliminar, reordenar).
3.3.Definicion de condicionales multiples y calculo de estadisticas agrupadas.
4.Tablas relacionales.
4.1.Bases de datos relacionales en SQL (primary key y foreign key).
4.2.Tipos de join (left, right, inner y full).
4.3.Joins mediante identificadores unicos y compuestos.
5.Visualizacion de datos.
5.1.Teoria de Grammar of Graphics.
5.2.Propiedades esteticas/graficas (posicion, color, agrupacion, estadisticas, etc.).
5.3.Personalizacion de escalas.
6.Machine learning.
6.1.Aprendizaje supervisado basado en arboles de decision (clasificacion).
6.2.Aprendizaje no supervisado basado en k-means (agrupacion).
IV.ESTRATEGIAS METODOLOGICAS
-Catedra.
-Laboratorio.
-Estudio de casos.
-Aprendizaje basado en problemas.
V.ESTRATEGIAS EVALUATIVAS
-Prueba escrita: 40%
-Informe: 60%
VI.BIBLIOGRAFIA
Minima
Healy, K.(2018). Data Visualization. A Practical Introduction. Available at: https://socviz.co/
Teetor, P.(2011). R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics. O?Reilly. Available at: https://rc2e.com/
Wickham, H.(2017). The tidyverse style guide. Available at: https://style.tidyverse.org/
Wickham, H. and Grolemund, G.(2017) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. Available at: https://r4ds.had.co.nz/
Wilke, C.(2020) Fundamentals of Data Visualization. A Primer on Making Informative and Compelling Figures. O?Reilly. Available at: https://clauswilke.com/dataviz/
Complementaria
Chang, W.(2020). R Graphics Cookbook Practical Recipes for Visualizing Data. Available at: https://r-graphics.org/
Irizarry, R.(2020). Introduction to Data Science: Data Analysis and Prediction Algorithms with R. Chapman and Hall/CRC. Available at: https://rafalab.github.io/dsbook/
Ismay, C. and Kim, A.(2020). Statistical Inference via Data Science. A ModernDive into R and the Tidyverse. Available at: https://moderndive.com/index.html
Kabacoff, R.(2018). Data Visualization with R. Available at: https://rkabacoff.github.io/datavis/
Peng, R.(2020). Programming for Data Science. Available at: https://bookdown.org/rdpeng/rprogdatascience/
Otros Recursos
Holtz, Y. and Healy, C.(2018). From data to Viz | Find the graphic you need. Available at:https://www.data-to-viz.com/#groupedbarplot%0Ahttps://www.data-to-viz.com/index.html%0Ahttps://www.data-to-viz.com/
RStudio Education. Finding Your Way to R. Available at:https://education.rstudio.com/learn/
RPubs. Available at: http://rpubs.com/
Tidyverse. R packages for data science. Available at: https://www.tidyverse.org/
RStudio Cheatsheets. Available at: https://rstudio.com/resources/cheatsheets/
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
INSTITUTO DE GEOGRAFIA / OCTUBRE 2021
Secciones
Sección 1 | Sebastian Valdivia |