ECON 4649 Seminario Minería de Datos y sus Aplicaciones

Recientemente se ha hablado de una nueva forma de inferencia científica (véase The Fourth Paradigm: Data Intensive Scientific Discovery. Microsoft Research, 2009.) basada en la exploración sistemática y asistida por herramientas computacionales, de gran cantidad de información digitalizada que ha venido almacenando el mundo desde los inicios de la era informática. Se trata del descubrimiento científico intensivo en datos o, simplemente, minería de datos.

Este seminario introduce a los estudiantes en  los pilares teóricos fundamentales de la moderna teoría de aprendizaje estadístico como marco teórico de la minería de datos (el problema de aprendizaje o machine learning, el compromiso entre sesgo y varianza, aproximación y error, riesgo, consistencia, regularización, complejidad, etc.) Posteriormente, y en s mayor parte (tres cuartas partes del seminario), se van a aprender las principales técnicas de minería de datos (método de vecindades, redes neuronales,  redes bayesianas, árboles,  boosting, cross validation, máquinas de vectores de soporte, clustering, etc.) a través de ejemplos y problemas que los estudiantes deberán implementar y resolver haciendo uso de un computador y, en lo posible, problemas que sean de su interés (datos de redes sociales, reconocimiento de caracteres, extracción de señales, etc.).

Créditos

4

Instructor

Álvaro Riascos

Prerequisite

Econometría 1 y Métodos matemáticos para economistas