EYP1707 Introducción al Manejo y Exploración de Datos

EscuelaMatemáticas
Área
Categorías
Créditos15

Prerequisitos

Sin requisitos
Sin restricciones

Calificaciones

Este ramo no ha sido calificado.

No hay comentarios.

CURSO : INTRODUCCION AL MANEJO Y EXPLORACION DE DATOS
TRADUCCION : INTRODUCCTION TO DATA MANAGEMENT AND EXPLORATION
SIGLA : EYP1707
CRÉDITOS : 15
MODULOS : 3 (2 CATEDRAS, 2 AYUDANTIAS)
CARACTER : MINIMO
TIPO : CATEDRA
CALIFICACION : ESTANDAR
DISCIPLINA : ESTADISTICA
PALABRAS CLAVE : ANALISIS EXPLORATORIO DE DATOS, BODEGAS DE DATOS, BASES DE DATOS, MANEJO DE DATOS



I. DESCRIPCIÓN DEL CURSO

El curso estudiara las principales tecnicas de manejo analitico de bases de datos, desde una introduccion a sus sistemas de almacenamiento, hasta la revision de tecnicas de analisis exploratorio y automatico de los datos.


II. OBJETIVOS DE APRENDIZAJE

1. Distinguir la arquitectura de las bodegas de datos
2. Aplicar tecnicas de pre procesamiento de bases a datos
3. Emplear herramientas computacionales especializadas para el manejo y exploracion de grandes volumenes de datos
4. Interpretar la informacion contenida en un conjunto de datos
5. Utilizar sistemas OLAP para la toma de decisiones en Inteligencia de Negocios
6. Aplicar tecnicas de clasificacion en el ambito de la mineria de datos y de analisis estadisticos
7. Aplicar tecnicas de agrupamiento en el ambito de la mineria de datos y de analisis estadisticos
8. Dominar el programa Excel a nivel de avanzado para la edicion y gestion de bases de datos


III. CONTENIDOS

1. Analisis descriptivo de datos
1.1. Medidas numericas de resumen
1.2. Representaciones graficas basicas
1.3. Visualizacion de datos
1.4. Medidas de similitud.

2. Pre procesamiento de datos
2.1 Manejo de datos ruidosos y datos faltantes
2.2 Discretizacion
2.3 Seleccion y transformacion de variables
2.4 Reduccion de dimensionalidad (analisis de componentes principales).

3. Grandes bases de datos y bodegas de datos (data warehouses).

4. Introduccion a sistemas OLAP
4.1 Bases de datos
4.2 Lenguajes de consultas
4.3 Extraccion de la informacion.

5. Clasificacion:
5.1 Arboles de decision
5.2 Naive Bayes
5.3 Evaluacion y seleccion de modelos
5.4 Metodos conjuntos.

6. Conglomerados:
6.1 K-medias
6.2 K-medoides
6.3 Metodos jerarquicos.

7. Uso de Excel
7.1 Funciones avanzadas en Excel: formulas avanzadas, formulas de referencia, rastreo, evaluacion formulas, calculos.
7.2 Graficos en Excel: graficos basicos, interactivos, con varios ejes, creacion de plantillas para graficos.
7.3 Manejo de bases de datos en Excel: eliminacion de duplicados, filtros y validacion de datos.
7.4 Gestion y analisis de datos: tablas dinamicas, graficos dinamicos, obtencion de datos externos

8. Access
8.1 Elementos basicos de Access
8.2 Importacion y exportacion de base de datos
8.3 Creacion de tablas de datos
8.4 Propiedades de los campos
8.5 Relaciones
8.6 Consultas
8.7 Consultas de resumen


IV. METODOLOGIA PARA EL APRENDIZAJE

- Clases expositivas
- Clases de ejercicios
- Laboratorios computacionales

V. EVALUACION DE APRENDIZAJES

- Pruebas escritas
- Desarrollo de laboratorios computacionales
- Examen final escrito


VI. BIBLIOGRAFIA

Minima

Han, J. and Kamber, M. Data Mining: concepts and techniques. Morgan Kaufmann, 2006.

Complementaria

Tan, P.N., Steinbach, M. and Kumar, V. Pearson Education Limited, 2014.
Mitchell, T. Machine Learning. McGraw-Hill. 1997.




PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
FACULTAD DE MATEMATICAS / Noviembre 2017


Secciones

Sección 1 Monica Bravo
Sección 2 (Sin Profesores)