EAA361A Análisis de Big Data
Escuela | Economía Y Administración |
Área | |
Categorías | |
Créditos | 10 |
Prerequisitos
Requisitos: EAA2210 y EAA2310 y EAE2510
Sin restricciones
Calificaciones
Basado en 1 calificaciones:
5
Recomendación
1 al 5, mayor es mejor
4
Dificultad
1 al 5, mayor es más difícil
10
Créditos estimados
Estimación según alumnos.
4
Comunicación con profesores
1 al 5, mayor es mejor
CURSO : ANALISIS DE BIG DATA
TRADUCCION : BIG DATA ANALYSIS
SIGLA : EAA361A
CRÉDITOS : 10
MÓDULOS : 03
CARÁCTER : OPTATIVO
TIPO : CATEDRA Y LABORATORIO
CALIFICACION : ESTANDAR
DISCIPLINA : ADMINISTRACION ? ESTADISTICA
PALABRAS CLAVE : ANALISIS ESTADISTICO, BIG DATA, MACHINE LEARNING, BUSINESS INTELLIGENCE
I. DESCRIPCIÓN DEL CURSO
El curso de Analisis de Big Data esta orientado a entregar las principales herramientas analiticas utilizadas en proyectos de Business Intelligence. En este curso se entregan conocimientos esenciales para la manipulacion de informacion y los principales fundamentos teoricos y practicos de un curso de Data Mining, asi los alumnos pueden desarrollar nuevas competencias que le generen un valor agregado cuando necesite analizar datos para la toma de decisiones estrategicas.
II. OBJETIVOS DE APRENDIZAJE
1. las principales fortalezas del dise?o de modelos de Business Intelligence y las herramientas y tecnicas que maneja un cientifico de datos.
2. Emplear los conocimientos adquiridos de sistemas de Big Data en el desarrollo de proyectos de Business Intelligence, accediendo a las nuevas infraestructuras que posibilitan el manejo de grandes volumenes de datos.
3. Aplicar herramientas orientadas a desarrollar un sistema de Big Data.
4. Usar herramientas de manejo de datos.
5. Aplicar modelos de visualizacion de datos.
6. Aplicar metodologias de analisis de Big Data.
7. Desarrollar rutinas en R para analizar datos.
III. CONTENIDOS
1. Sistemas de Big Data y Manipulacion de Datos.
1.1. Introduccion a sistemas de bases de datos SQL
1.2. SQL Queries con Microsoft SQL Server
1.2.1. Terminologia de procesamiento de datos y conceptos de SQL: Tabla, Filas, Columnas
1.2.2. Consultas basicas SQL: Select, Where, Group By, Having, Order By
1.2.3. Combinacion de Tablas y Subconsultas: Inner joins, left joins, full joins, in select
1.2.4. Operadores de conjuntos: Except, Intersect, Union, Outer Union
1.2.5. Vistas e indices: Consultas actualizadas, optimacion de busquedas y de combinacion de tablas
1.3. Lenguaje R
1.3.1. Conceptos basicos de R
1.3.2. Exportaccion e importacion de flat table
1.3.3. Cargar librerias
1.3.4. Programacion iterativa y booleanos: for, while, if, function
1.3.5. Plotly y ggplot2
1.4. Visualizacion Descriptiva HTML con R
1.4.1. Shiny con Plotly y ggplot2
1.5. Conexion a bases de datos SQL - R
1.5.1. Libreria RODBC: Conexion ODBC, Query
1.6. Introduccion a bases de datos No-SQL
2. Data Mining y Aplicaciones de Negocios
2.1. Introduccion a Data Mining
2.1.1. Escenario multivariado de la informacion: Representacion, Estadisticos, Dependencia.
2.1.2. Metodologia SEMMA
2.1.3. Metricas de Data Mining
2.2. Modelos de Scoring para Riesgo de Credito: Aplicacion utilizando Regresiones Dicotomicas.
2.3. Modelos de Propension para Bussiness Intelligence: Aplicacion utilizando Redes Neuronales.
2.4. Segmentacion de Clientes: Aplicacion de metodos no supervisados utilizando K-means.
2.5. Sistema de Recomendador. Aplicacion utilizando Regresion y Analisis Factorial.
2.6. Text Mining.
3. Visualizacion y Reporte
3.1. R Studio
3.1.1. Shiny con ggplot2, Markdown, Highcharter
3.2. Microsoft Power BI
IV. METODOLOGIA PARA EL APRENDIZAJE
- Clases expositivas
- Laboratorio con Microsoft SQL Server, R, R Studio y Power BI.
- Lectura y discusion de textos
- Analisis de casos
V. EVALUACION DE APRENDIZAJES
- Trabajos: 70%
- Proyecto final: 30%
VI. BIBLIOGRAFIA
MINIMA
Hastie, Trevor and Tibshirani, Robert and Friedman, Jerome, An Introduction to Statistical Learning: With Applications in R, Springer Publishing Company, USA, 2014.
Ben-Gan, Itzik, T-SQL Fundamentals, 3rd Edition Microsoft Press, USA, 2016.
COMPLEMENTARIA
James, Gareth and Witten, Daniela and Hastie, Trevor and Tibshirani, Robert, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition, Springer Series in Statistic, USA, 2010.
McAfee, Andrew and Brynjolfsson, Erik, Big Data: The Management Revolution, Harvard business review, USA, 2012.
Marshall, Pablo, El Valor del Big Data, Columna el Mercurio, 15 de agosto 2015.
Provost, Foster and Fawcett, Tom, Data Science for Business: What you need to know about data mining and data-analytic thinking, O'Reilly Media, Incc, USA, 2013.
Zhao, Yanchang, R and Data Mining: Examples and Case Studies, Elsevier, 2015.
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS / OCTUBRE 2017
Secciones
Sección 1 | Cristian Vasquez |