EYP3707 Métodos Estadísticos para el Manejo de Grandes Volúmenes de Datos

EscuelaMatemáticas
Área
Categorías
Créditos10

Prerequisitos

Requisitos: EYP2707 o EYP2706
Sin restricciones

Calificaciones

Este ramo no ha sido calificado.

No hay comentarios.

CURSO: METODOS ESTADISTICOS PARA EL MANEJO DE GRANDES VOLUMENES DE DATOS
TRADUCCION: STATISTICAL METHODS FOR BIG DATA
SIGLA: EYP3707
CREDITOS: 10
MODULOS: 03 (02 CATEDRAS, 01 AYUDANTIA)
CARACTER: MINIMO
TIPO: CATEDRA
CALIFICACION: ESTANDAR
DISCIPLINA: ESTADISTICA
PALABRAS CLAVE: MINERIA DE DATOS, BIG DATA


I. DESCRIPCIÓN DEL CURSO

En este curso el estudiante aplicara metodos computacionales para la gestion, analisis y modelamiento de grandes volumenes de datos, los que surgen cada vez mas frecuentemente en la practica. El foco principal es en las aplicaciones, lo que se manifiesta en la experiencia practica a desarrollar, pero tambien se discutiran algunos de los fundamentos teoricos que sustentan la metodologia presentada.


II. OBJETIVOS DE APRENDIZAJE

1. Identificar el metodo adecuado para el analisis de grandes volumenes de datos.
2. Evaluar metodos parametricos, semi?parametricos o no parametricos para el manejo de grandes volumenes de datos.
3. Aplicar tecnicas computacionales con el software estadistico para el manejo de grandes volumenes de datos.


III. CONTENIDO

1. Introduccion a la mineria de datos
1.1. Ejemplos de grandes volumenes de datos (Big Data)
1.2. Metodos con supervision y metodos sin supervision
1.3. Metodos parametricos y metodos no parametricos
1.4. Regresion y Clasificacion

2. Reduccion de la dimension
2.1. Metodo de descenso por gradiente
2.2. Analisis de componentes principales
2.3. Minimos cuadrados parciales

3. Metodos de regularizacion y Seleccion de variables
3.1. Regularizacion de Ridge
3.2. Regularizacion LASSO
3.3. Seleccion de variables forward y backward

4. Arboles
4.1. Arboles de regresion
4.2. Arboles de clasificacion
4.3. Bosques Aleatorios

5. Analisis de conglomerados
5.1. Conglomerados de K medias
5.2. Analisis de conglomerados jerarquico
5.3. Algoritmo CURE

6. Maquinas de vector soporte
6.1. Clasificacion con hiperplano
6.2. Clasificacion con fronteras no lineales
6.3. Clasificador de vector soporte
6.4. Maquina de vector soporte

7. Reglas de asociacion
7.1. Algoritmos a priori
7.2. Algoritmos aleatorizados


II. METODOLOGIA PARA EL APRENDIZAJE

- Clases expositivas
- Desarrollo de proyectos
- Laboratorios


III. EVALUACION DE APRENDIZAJES

- Pruebas escritas
- Presentaciones de proyectos
- Examen final escrito


IV. BIBLIOGRAFIA

Minima

Rajaraman A., Ullman J. (2012). Mining of Massive datasets. Cambridge University Press.

Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning. Springer, NY.


Complementaria

Buhlmann P., Drineas P., Kane M., Laan M., Handbook of Big Data (2016). CRC Press.


PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
FACULTAD DE MATEMATICAS / NOVIEMBRE 2017


Secciones

Sección 1 Pedro Ramos