IIND4123 Statistical Learning for Data Analytics

Este curso presenta conceptos y métodos estadísticos para el análisis de datos bajo el enfoque de modelamiento predictivo (machine learning). Los modelos predictivos buscan aproximar el valor de una variable de interés en términos de valores particulares de las variables predictoras, usando una función que debe ser estimada (aprendida) a partir de datos. Incluye problemas de regresión (predicción de variable continua, por ejemplo, predecir el monto de una transacción electrónica), clasificación (predicción de variable categórica, por ejemplo, predecir si la transacción es fraude o no), ranking (ordenamiento de la variable de respuesta) y aprendizaje no-supervisado (cuando la respuesta no es observable). A diferencia de modelos estadísticos clásicos, los modelos predictivos se evalúan a partir de su eficacia para pronosticar la respuesta y no necesariamente en su capacidad para explicar las relaciones entre las variables. En el curso se incluyen técnicas de minería de datos, de machine learning y de reconocimiento de patrones.


El enfoque central es cómo usar estas técnicas para crear métodos que sean buenos predictores desde el punto de vista estadístico, y no solamente como una herramienta de minería de datos. Así mismo, se hará énfasis en la implementación computacional de algoritmos para el análisis de datos y el uso de software. También se tratarán aplicaciones relevantes a la Ingeniería Industrial y el desarrollo de casos de estudio, como por ejemplo: detección de fraude, modelos de puntaje (scoring), confiabilidad de productos, determinación de factores de éxito, sistemas de recomendación, entre otras.

Los objetivos primarios del curso son: 1) Comprender los conceptos generales del modelamiento predictivo: buen uso de los datos, dimensión y complejidad del problema, evaluación y selección de mejores modelos. 2) Aprender a utilizar herramientas computacionales que permitan la correcta aplicación de los métodos vistos. 3) Comprender los conceptos fundamentales de cada técnica vista en el curso, incluyendo sus supuestos y limitaciones. 4) Desarrollar habilidades para el análisis, comprensión y comunicación de resultados de los modelos.

Créditos

4

Periodo en el que se ofrece el curso

201810 - 201820

Idioma en el que se ofrece el curso

Español