EYP3707 Métodos Estadísticos para el Manejo de Grandes Volúmenes de Datos
Escuela | Matemáticas |
Área | |
Categorías | |
Créditos | 10 |
Prerequisitos
Requisitos: EYP2707 o EYP2706
Sin restricciones
Calificaciones
Este ramo no ha sido calificado.
CURSO: METODOS ESTADISTICOS PARA EL MANEJO DE GRANDES VOLUMENES DE DATOS
TRADUCCION: STATISTICAL METHODS FOR BIG DATA
SIGLA: EYP3707
CREDITOS: 10
MODULOS: 03 (02 CATEDRAS, 01 AYUDANTIA)
CARACTER: MINIMO
TIPO: CATEDRA
CALIFICACION: ESTANDAR
DISCIPLINA: ESTADISTICA
PALABRAS CLAVE: MINERIA DE DATOS, BIG DATA
I. DESCRIPCIÓN DEL CURSO
En este curso el estudiante aplicara metodos computacionales para la gestion, analisis y modelamiento de grandes volumenes de datos, los que surgen cada vez mas frecuentemente en la practica. El foco principal es en las aplicaciones, lo que se manifiesta en la experiencia practica a desarrollar, pero tambien se discutiran algunos de los fundamentos teoricos que sustentan la metodologia presentada.
II. OBJETIVOS DE APRENDIZAJE
1. Identificar el metodo adecuado para el analisis de grandes volumenes de datos.
2. Evaluar metodos parametricos, semi?parametricos o no parametricos para el manejo de grandes volumenes de datos.
3. Aplicar tecnicas computacionales con el software estadistico para el manejo de grandes volumenes de datos.
III. CONTENIDO
1. Introduccion a la mineria de datos
1.1. Ejemplos de grandes volumenes de datos (Big Data)
1.2. Metodos con supervision y metodos sin supervision
1.3. Metodos parametricos y metodos no parametricos
1.4. Regresion y Clasificacion
2. Reduccion de la dimension
2.1. Metodo de descenso por gradiente
2.2. Analisis de componentes principales
2.3. Minimos cuadrados parciales
3. Metodos de regularizacion y Seleccion de variables
3.1. Regularizacion de Ridge
3.2. Regularizacion LASSO
3.3. Seleccion de variables forward y backward
4. Arboles
4.1. Arboles de regresion
4.2. Arboles de clasificacion
4.3. Bosques Aleatorios
5. Analisis de conglomerados
5.1. Conglomerados de K medias
5.2. Analisis de conglomerados jerarquico
5.3. Algoritmo CURE
6. Maquinas de vector soporte
6.1. Clasificacion con hiperplano
6.2. Clasificacion con fronteras no lineales
6.3. Clasificador de vector soporte
6.4. Maquina de vector soporte
7. Reglas de asociacion
7.1. Algoritmos a priori
7.2. Algoritmos aleatorizados
II. METODOLOGIA PARA EL APRENDIZAJE
- Clases expositivas
- Desarrollo de proyectos
- Laboratorios
III. EVALUACION DE APRENDIZAJES
- Pruebas escritas
- Presentaciones de proyectos
- Examen final escrito
IV. BIBLIOGRAFIA
Minima
Rajaraman A., Ullman J. (2012). Mining of Massive datasets. Cambridge University Press.
Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning. Springer, NY.
Complementaria
Buhlmann P., Drineas P., Kane M., Laan M., Handbook of Big Data (2016). CRC Press.
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
FACULTAD DE MATEMATICAS / NOVIEMBRE 2017
Secciones
Sección 1 | Pedro Ramos |