Aprendizaje Estadístico 2025
Este es un curso introductorio al aprendizaje estadístico, con énfasis principalmente en los fundamentos matemáticos y estadísticos de los principales algoritmos de aprendizaje automático y reconocimiento de patrones. El tema central del curso es el estudio de métodos para obtener información útil a partir de datos. Abordamos temas principales como el aprendizaje supervisado y no supervisado, los modelos de regresión, y algunos tópicos recientes como el aprendizaje profundo. Al final del curso, los estudiantes comprederán los fundamentos de los algoritmos más populares del aprendizaje estadístico. Para aprovechar de mejor manera el curso, es recomendable que los estudiantes estén familiarizados con temas de álgebra lineal, cálculo, estadística matemática, y tener conocimientos de al menos un lenguaje de programación (e.g. Python, R, Matlab, C++, u otros).
Programa del curso
Horario
- Miércoles, de 19:50 a 21:25 horas, y viernes de 18:10 a 19:45.
Office Hours
- Por definir. Por solicitud del estudiante. También pueden enviar sus dudas por correo electrónico.
Material del curso
No. | Fecha | Tópicos | Recursos |
---|---|---|---|
01 | 15.01.2025 | Introducción. Repaso de Probabilidad. Aula 01 |
|
02 | 17.01.2025 | Variables aleatorias. Densidad y función de distribución. Aula 02 | rvs.ipynb |
03 | 22.01.2025 | Función de cuantiles. Contraste entre distribuciones. PP-plots, QQ-plots, KS. | qqplots.ipynb fitting.ipynb |
04 | 24.01.2025 | Estadísticos. Entropía, información mutua, Kullback-Leibler. Aula 03 | data_exploration.ipynb |
05 | 24.01.2025 | Funciones multivariadas. Normal multivariada. Aula 04 | generate_gaussian.ipynb |
06 | 29.01.2025 | Análisis de Componentes Principales. Aula 05 |
pca.ipynb deport.csv |
07 | 31.01.2025 | Interpretación del PCA. Aula 06 |
|
L1 | 31.01.2025 | Lista 1. Fecha de Entrega: 14 de febrero. | Lista 01 areas.csv |
08 | 05.02.2025 | Escalamiento Multidimensional. Aula 07 |
md_scaling.ipynb |
09 | 07.02.2025 | Distancia de Mahalanobis. Kernel PCA, Volume Ellipsoid Method. Aula 08 | kernel-pca.ipynb kernel-pca2.ipynb |
10 | 12.02.2025 | Variables latentes: Análisis de Componentes Independientes (ICA). Aula 09 | ica.ipynb horse.jpg morro.jpg plane.jpg race.jpg |
11 | 12.02.2025 | Factoración No-Negativa de Matrices (NNMF). Sistemas de Recomendación. Aula 10 | movies.csv ratings.csv recommender.ipynb |
L2 | 14.02.2025 | Lista 2. Fecha de Entrega: 28 de febrero. | Lista 02 weather.csv crimes.dat |
12 | 19.02.2025 | Manifold Learning I: Isomap, SNE y t-SNE, UMAP. Aula 11 | |
13 | 21.02.2025 | Manifold Learning II: Spectral embedding, LLE, SOM. Aula 12 | |
14 | 26.02.2025 | Estimación de densidades por kernels (KDE). Aula 13 |
|
15 | 28.02.2025 | Agrupamiento jerárquico. Aula 14 |
|
L3 | 05.03.2025 | Lista 3. Fecha de Entrega: 21 de marzo. | Lista 3 wines.csv hpi-data-2016.xlsx countries_binary.xlsx |
16 | 07.03.2025 | K-means y variantes de K-means. Aula 15 |
|
17 | 12.03.2025 | Métodos de agrupamiento basados en densidad: Means-Shift, DBSCAN, OPTICS, BIRCH. Aula 16 | |
18 | 14.03.2025 | Mezclas gaussianas. Algoritmo EM. Aula 17 |
|
19 | 19.03.2025 | Agrupamiento espectral. Algoritmo de Shi-Malik. Aula 18 | |
20 | 21.03.2025 | Métricas para algoritmos de clustering. Aula 19 |
clustering-metrics.ipynb silhouette.ipynb |
21 | 26.03.2025 | Modelación predictiva. Aula 20 |
|
22 | 26.03.2025 | KNN. Aula 21 |
|
23 | 02.04.2025 | El clasificador bayesiano óptimo. |
|
24 | 09.04.2025 | Presentación de seminarios del Primer Proyecto. | |
25 | 23.04.2025 | Cálculo teóríco del clasificador bayesiano. |
|
26 | 25.04.2025 | Optimalidad del clasificador bayesiano. Cotas de error. Ejemplos. |
|
27 | 30.04.2025 | Naïve Bayes. Cálculo de la conjunta sin independencia. |
|
28 | 02.05.2025 | Análisis Discriminante. |
|
29 | 07.05.2025 | Árboles de Decisión. |
|
30 | 09.05.2025 | Modelos de ensamblaje. Random Forests. |
|
31 | 14.05.2025 | Modelos lineales I: regresión logística. |
|
32 | 16.05.2025 | Modelos lineales II: Perceptrón. SVM. |
|
33 | 21.05.2025 | Regresión lineal: OLS. Ecuaciones normales. |
|
34 | 23.05.2025 | Regresión lineal: pruebas de hipótesis, gráficos de diagnóstico. | |
35 | 23.05.2025 | Ejemplos de regresión en Statsmodels. | |
36 | 04.06.2025 | Presentación de proyectos finales. |
Proyectos
En el curso se elaborarán dos proyectos, los cuales se describen a continuación.
Primer Proyecto (Ecobici)
No. | Fecha | Tópicos |
---|---|---|
P1 | 07.03.2025 | Proyecto 1 Coordenadas de estaciones stations.json stations.csv |
. | 09-11.04.2025 | Presentaciones |
. | 11.04.2025 | Entrega del reporte, código y presentación |
Segundo Proyecto (Tema Libre)
No. | Fecha | Tópicos |
---|---|---|
P2 | 08.05.2025 | Indicaciones del proyecto 2. |
. | 20.05.2025 | Fecha límite para elegir tema. |
. | 02-06.06.2025 | Presentaciones |
Horarios presentaciones Proyecto 2
Fecha | Tópicos | Tema |
---|---|---|
04.06.2025 | Sebastián y Aarón | Clasificación de Solicitudes de Préstamos |
04.06.2025 | Mario y Mariel | Análisis de Comportamiento del Consumidor |
04.06.2025 | Pablo, Ximena y Juan Pablo | Predicción Taxonómica de Mariposas en Australia |
04.06.2025 | Jorge y Allan | Clasificación de Anime |
04.06.2025 | Juan Luis y Nicolle | Indicadores económicos |
04.06.2025 | Sharis y Montse | Predicción de Churn en clientes |
06.06.2025 | Diana y Franco | Abandono en planes de subscripción |
06.06.2025 | Joab y Paulo | Detección de Fake News |
06.06.2025 | Manu y Sofi | Clasificación de riesgo crediticio |
06.06.2025 | Juan Miguel y Pedro | Detección de Fraude en tarjetas de crédito |
06.06.2025 | Gaby y Lou | Clasificación de granos de café |
Referencias
Textos:
Referencias adicionales:
-
T. Hastie, R. Tibshirani, J. Friedman (2013). The Elements of Statistical Learning.
-
K. Murphy (2012). Machine Learning: a Probabilistic Perspective.
-
K. Fukunaga (1990). Introduction to Statistical Pattern Recognition.
-
C. Giraud (2021). Introduction to High-Dimensional Statistics.
Referencias avanzadas:
-
L. Devroye, L. Györfi, G. Lugosi (1996). A Probabilistic Theory of Pattern Recognition.
-
S. Shalev-Shwartz, S. Ben-David (2014). Understanding Machine Learning: From Theory to Algorithms.