MAIA4332 Modelos avanzados para el procesamiento de lenguaje natural

Este curso ofrece una introducción profunda a los modelos avanzados de procesamiento de lenguaje natural (NLP) basados en deep learning. A lo largo de ocho semanas, los estudiantes explorarán desde modelos neuronales básicos, como regresión logística y redes feedforward, hasta arquitecturas avanzadas como RNN, LSTM, modelos encoder-decoder y Transformers. Se abordarán técnicas fundamentales como la tokenización con BPE y WordPiece, embeddings estáticos y contextuales, y el mecanismo de autoatención. Además, se estudiarán grandes modelos de lenguaje (LLMs), su generación de texto mediante muestreo, y estrategias para su ajuste fino (fine-tuning) en tareas específicas. También se explorará la ingeniería de prompts para mejorar la interacción con LLMs y se discutirán consideraciones éticas en la implementación de modelos de NLP.

En este curso aprenderás:

  • Aplicar técnicas avanzadas de NLP para resolver problemas que involucren texto escrito.
  • Implementar modelos de lenguaje con arquitecturas de deep learning, optimizando representaciones textuales.
  • Comprender los principios detrás del ajuste fino de modelos preentrenados y las estrategias para mejorar la generación de texto.
 
 

Créditos

2

Periodo en el que se ofrece el curso

2025

Idioma en el que se ofrece el curso

Español