EPG3730 Métodos Exploratorios y Computacionales para Estadística
Escuela | Matemáticas |
Área | |
Categorías | |
Créditos | 10 |
Prerequisitos
Sin requisitos
Restricciones: (Programa = Doct En Estadistica)
Calificaciones
Basado en 3 calificaciones:
3,7
Recomendación
1 al 5, mayor es mejor
3,3
Dificultad
1 al 5, mayor es más difícil
12,3
Créditos estimados
Estimación según alumnos.
3,7
Comunicación con profesores
1 al 5, mayor es mejor
CURSO : Metodos Exploratorios y Computacionales para Estadistica
TRADUCCION : Computational and exploratory methods in statistics
SIGLA : EPG3730
CREDITOS : 10 UC / 6 SCT
MODULOS : 2 Clases de Catedra y 1 Ayudantia
REQUISITOS : Admision Doctorado en Estadistica
RESTRICCIONES : No aplica
CARACTER : Minimo
TIPO : Catedra
CALIFICACION : Estandar (calificacion de 1.0 a 7.0)
PROFESOR :
I. DESCRIPCION
En este curso se definen formalmente una serie de metodos de visualizacion de informacion, ilustrando su aplicacion en el analisis exploratorio de datos y en la comunicacion de un analisis estadistico.
II. OBJETIVOS
Preparar el alumno para: buscar por evidencia de estructura y patrones; comprender rigurosamente conceptos claves de visualizacion; interpretar dichos metodos graficos; comunicar ideas y conceptos a traves de metodos graficos.
III. CONTENIDOS
1. Introduccion a la teoria y aplicaciones de metodos de visualizacion
1.1. Motivacion
1.2. El analisis grafico como forma de explorar y comunicar
1.3. Definicion matematica de grafico
1.4. Principios de representacion grafica (Cleveland 1993, 1994)
1.5. R: Parametros graficos (R: lwd, col,?)
1.6. R: Notacion matematica (Murrell y Ihaka 2000)
1.7. R: Introduccion al paquete ggplot2 (Wickham 2016)
2. Visualizacion de datos continuos
2.1. Estimador del histograma (definicion matematica; reglas de Sturges, Scott y Freedman?Diaconis)
2.2. Boxplot
2.3. Estimador de kernel (R: density, paquete stats)
2.4. Density plot y `rug?(R: density, plot y rug)
2.5. Violin plot (R: vioplot package)
3. Visualizacion de datos categoricos
3.1. Ejemplos de datos categoricos
3.2. Mosaic plot (Hartigan y Kleiner 1984; Friendly 1994; R: mosaicplot, paquete graphics)
4. Visualizacion y comparacion de poblaciones
4.1. QQ-plot
4.2. Curva ROC
5. Visualizacion de datos continuos bivariados
5.1. Scatterplot y suavizador del scatterplot (loess, paquete stats)
5.2. Reduccion de dimension a traves de componentes principales
5.3. Biplot (Jolliffe 2002, ?5.3; Gower y Hand 1996; biplot, paquete stats)
6. Visualizacion de datos composicionales
6.1. Ejemplos de datos composicionales
6.2. El simplex unitario
6.3. La distribucion de Dirichlet
6.4. Density contour plot en el simplex
7. Visualizacion de series de tiempo
7.1. Grafico de series de tiempo (ts, paquete stats)
7.2. Correlograma (acf, paquete stats)
7.3. Periodograma (spectrum, paquete stats)
7.4. Grafico STL (Cleveland et al 1990; stl, paquete stats)
8. Visualizacion de datos funcionales
8.1. Curvas aleatorias como datos: Ejemplos
8.2. El proceso estocastico como modelo para funciones aleatorias
8.3. Medidas de profundidad para datos funcionales (Sun y Genton 2011)
8.4. Boxplot funcional (fbplot, paquete fda)
IV. METODOLOGIA
- Clases expositivas.
- Lecturas recomendadas por el profesor incluyendo, por ejemplo, un articulo reciente del Journal of Computational and Graphical Statistics o algunos articulos en la Bibliografia (VI).
V. EVALUACION
- La evaluacion del curso consistira en 3 interrogaciones (70%) y un examen final (30%).
VI. BIBLIOGRAFIA
? Cleveland, W. S. (1993), Visualizing Data, New Jersey: Hobart Press.
? ?? (1994), The Elements of Graphing Data, Revised edition, New Jersey: Hobart Press.
? Cleveland, R. B. Cleveland, W. S. McRae, J. E. y Terpenning, I. (1990), ?STL: A Seasonal-Trend Decomposition Procedure Based on Loess,? Journal of Official Statistics, 6, 3?73.
? Cleveland, W. S. Grosse, E. y Shyu, W. M. (1992), ?Local Regression Models,? Chapter 8 of Statistical Models in S Eds J. M. Chambers y T. J. Hastie, Wadsworth & Brooks/Cole.
? Friendly, M. (1994), ?Mosaic Displays for Multi-Way Contingency Tables,? Journal of the American Statistical Association, 89, 190?200.
? Gower, J. C. y Hand, D. J. (1996). Biplots. Boca Raton: Chapman & Hall/CRC.
? Hartigan, J. A. y Kleiner, B. (1984), ?A Mosaic of Television Ratings,? The American Statistician, 38, 32?35.
? Keen, K. J. (2010), Graphics for Statistics and Data Analysis with R, Boca Raton: Chapman & Hall/CRC.
? Jolliffe, I. (2002), Principal Component Analysis, Springer: New York.
? Murrell, P. (2005), R Graphics. Chapman & Hall/CRC Press.
? Murrell, P. y Ihaka, R. (2000), ?An Approach to Providing Mathematical Annotation in Plots,? Journal of Computational and Graphical Statistics, 9, 582?599.
? Sun, Y. y Genton, M. G. (2011), ?Functional Boxplots,? Journal of Computational and Graphical Statistics, 20, 316?334.
? Wickham, H. (2016), ggplot2: Elegant Graphics for Data Analysis, 2nd Edition, New York: Springer.
? Unwin, A. (2015), Graphical Data Analysis with R, Boca Raton: Chapman & Hall/CRC.
Secciones
Sección 1 | Ernesto San Martín |
(2021-1) krojam: Es un curso muy ameno. La clave (en mi opinión) está en comprender el trasfondo de todas las clases en suma; porque todas son como un caminito que se va construyendo para llevar a cierto lugar.
(2022-1) marco.vergara: Si toman este ramo con Vicente García Huidobro será una experiencia interesante y podrán aprender varias cosas interesantes. Si lo toman con Andrés Haye... Les deseo la mejor de las suertes y que Dios los ampare.