GEO5059 Introducción a la Ciencia de Datos Con R

EscuelaGeografía
Área
Categorías
Créditos10

Prerequisitos

Sin requisitos
Restricciones: ((Nivel = Doctorado) o (Nivel = Magister))

Calificaciones

Este ramo no ha sido calificado.

No hay comentarios.

CURSO:INTRODUCCION A LA CIENCIA DE DATOS CON R
TRADUCCION:INTRODUCTION TO DATA SCIENCE WITH R
SIGLA:GEO5059
CREDITOS:10
MODULOS:02
CARACTER:OPTATIVO
TIPO:LABORATORIO
CALIFICACION:ESTANDAR
PALABRAS CLAVE:DATA SCIENCE, R, PROGRAMACION, BASES DE DATOS
NIVEL FORMATIVO:MAGISTER


I.DESCRIPCIÓN DEL CURSO

En este curso las y los estudiantes desarrollaran habilidades de programacion basadas en el lenguaje R orientadas a la ciencia de datos. Mediante actividades de laboratorio, estudio de casos y aprendizaje basado en problemas se exploraran herramientas para transformar datos no procesados en conocimiento util, abordando tematicas urbanas, medioambientales y sociales. Las evaluaciones consideran la puesta en practica de los aprendizajes mediante la realizacion de ejercicios de programacion aplicados, controles y trabajos practicos.


II.RESULTADOS DE APRENDIZAJE

1.Crear scripts de codigo utilizando el lenguaje de programacion R.

2.Implementar el flujo de trabajo asociado a la ciencia de datos para el trabajo reproducible con datos tabulares.

3.Aplicar tecnicas para el procesamiento y manipulacion de datos para el trabajo con informacion no procesada.


III.CONTENIDOS

1.Fundamentos de programacion en R.
1.1.Familiarizacion con ambiente RStudio.
1.2.Objetos, vectores, funciones y paquetes.
1.3.Tipos y clases de datos.

2.Calidad de datos.
2.1.Fuente de errores y preprocesamiento de datos.
2.2.Estadisticos descriptivos de resumen.
2.3.Importacion y exportacion de datos.

3.Manipulacion y transformacion de datos.
3.1.Construccion de queries o consultas - operadores relacionales y booleanos (seleccion de filas).
3.2.Manejo columnas (seleccionar, renombrar, eliminar, reordenar).
3.3.Definicion de condicionales multiples y calculo de estadisticas agrupadas.

4.Tablas relacionales.
4.1.Bases de datos relacionales en SQL (primary key y foreign key).
4.2.Tipos de join (left, right, inner y full).
4.3.Joins mediante identificadores unicos y compuestos.

5.Visualizacion de datos.
5.1.Teoria de Grammar of Graphics.
5.2.Propiedades esteticas/graficas (posicion, color, agrupacion, estadisticas, etc.).
5.3.Personalizacion de escalas.

6.Machine learning.
6.1.Aprendizaje supervisado basado en arboles de decision (clasificacion).
6.2.Aprendizaje no supervisado basado en k-means (agrupacion).


IV.ESTRATEGIAS METODOLOGICAS

-Catedra.

-Laboratorio.

-Estudio de casos.

-Aprendizaje basado en problemas.


V.ESTRATEGIAS EVALUATIVAS

-Prueba escrita: 40%

-Informe: 60%


VI.BIBLIOGRAFIA

Minima

Healy, K.(2018). Data Visualization. A Practical Introduction. Available at: https://socviz.co/

Teetor, P.(2011). R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics. O?Reilly. Available at: https://rc2e.com/

Wickham, H.(2017). The tidyverse style guide. Available at: https://style.tidyverse.org/

Wickham, H. and Grolemund, G.(2017) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. Available at: https://r4ds.had.co.nz/

Wilke, C.(2020) Fundamentals of Data Visualization. A Primer on Making Informative and Compelling Figures. O?Reilly. Available at: https://clauswilke.com/dataviz/


Complementaria

Chang, W.(2020). R Graphics Cookbook Practical Recipes for Visualizing Data. Available at: https://r-graphics.org/

Irizarry, R.(2020). Introduction to Data Science: Data Analysis and Prediction Algorithms with R. Chapman and Hall/CRC. Available at: https://rafalab.github.io/dsbook/

Ismay, C. and Kim, A.(2020). Statistical Inference via Data Science. A ModernDive into R and the Tidyverse. Available at: https://moderndive.com/index.html

Kabacoff, R.(2018). Data Visualization with R. Available at: https://rkabacoff.github.io/datavis/

Peng, R.(2020). Programming for Data Science. Available at: https://bookdown.org/rdpeng/rprogdatascience/


Otros Recursos

Holtz, Y. and Healy, C.(2018). From data to Viz | Find the graphic you need. Available at:https://www.data-to-viz.com/#groupedbarplot%0Ahttps://www.data-to-viz.com/index.html%0Ahttps://www.data-to-viz.com/

RStudio Education. Finding Your Way to R. Available at:https://education.rstudio.com/learn/

RPubs. Available at: http://rpubs.com/

Tidyverse. R packages for data science. Available at: https://www.tidyverse.org/

RStudio Cheatsheets. Available at: https://rstudio.com/resources/cheatsheets/


PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
INSTITUTO DE GEOGRAFIA / OCTUBRE 2021


Secciones

Sección 1 Sebastian Valdivia