INF3862 Plataformas de Big Data para Data Science
Escuela | Ingeniería |
Área | |
Categorías | |
Créditos | 5 |
Prerequisitos
Sin requisitos
Restricciones: (Programa = Mg Intel Artif)
Calificaciones
Este ramo no ha sido calificado.
CURSO:PLATAFORMAS DE BIG DATA PARA DATA SCIENCE
TRADUCCION:BIG DATA PLATFORMS FOR DATA SCIENCE
SIGLA:INF3862
CREDITOS:05
MODULOS:02
CARACTER:MINIMO
TIPO:CATEDRA,LABORATORIO
CALIFICACION:ESTANDAR
DISCIPLINA:INGENIERIA,COMPUTACION
PALABRAS CLAVE:COMPUTACION,INTELIGENCIA,ARTIFICIAL,CIENCIA,DATOS,PLATAFORMAS,BIG,DATA,SCIENCE
PROFESOR:IVAN LILLO
I.DESCRIPCIÓN DEL CURSO
En este curso los estudiantes analizaran el framework Hadoop como base explicativa y practica de un ecosistema de Big Data. Ademas, veran otras plataformas comunes para el procesamiento de grandes volumenes de datos. Este curso proveera de tecnicas para almacenar, extraer y procesar informacion, extrayendo valor desde fuentes de datos existentes y descubriendo nuevas fuentes.
II.RESULTADOS DE APRENDIZAJE
1.Distinguir distintos elementos de datos relacionados con Big Data en su propio entorno o en problemas del dia a dia.
2.Analizar la necesidad de contar con un plan de infraestructura de Big Data y un dise?o adecuado de Sistemas de Informacion en el contexto de una organizacion.
3.Diferenciar entre un sistema de manejo de datos tradicional y un sistema de manejo de Big Data.
4.Dise?ar un sistema de informacion para el manejo de un gran volumen de datos, con una vision integradora de las multiples herramientas existentes.
5.Aplicar las bases del dise?o de arquitectura y modelos de programacion existentes para grandes volumenes de datos.
6.Proponer soluciones a problemas que generan grandes volumenes de informacion usando herramientas pensadas en Big Data.
7.Describir problemas eticos y de privacidad en el manejo de datos.
III.CONTENIDOS
1.Introduccion al paradigma de Big Data y plataformas comunes.
2.Hadoop (MapReduce, HDFS, Yarn, Tez).
3.Hadoop Ecosystem (Sqoop, Hive, Hbase, Pig, Flume, Oozie).
4.Apache Spark.
5.Plataformas de software y servicios.
6.Solvers de Optimizacion.
IV.ESTRATEGIAS METODOLOGICAS
-Clases expositivas
-Talleres practicos de laboratorio
V.EVALUACION DEL APRENDIZAJE
-Controles: 30%
-Actividades practicas en laboratorio: 30%
-Proyecto: 40%
VI.BIBLIOGRAFIA
Minima
Este curso no requiere bibliografia minima.
Complementaria
J. R. Owens, B. Femiano, and J. Lentz, Hadoop Real World Solutions Cookbook. Packt Publishing, 2013.
Documentacion web actualizada
Apache Hadoop http://hadoop.apache.org/docs/current/
Apache Spark https://spark.apache.org/docs/latest/
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
ESCUELA DE INGENIERIA / ENERO 2020
Secciones
Sección 1 | Cristian Rodriguez |