Elements of Machine Learning 2025
Este es un curso introductorio al aprendizaje estadístico, con énfasis principalmente en los fundamentos matemáticos y estadísticos de los principales algoritmos de aprendizaje automático y reconocimiento de patrones. El tema central del curso es el estudio de métodos para obtener información útil a partir de datos. Abordamos temas principales como el aprendizaje supervisado y no supervisado, los modelos de regresión, y algunos tópicos recientes como el aprendizaje profundo.
Al final del curso, los estudiantes comprederán los fundamentos de los algoritmos más populares del aprendizaje estadístico. Para aprovechar de mejor manera el curso, es recomendable que los estudiantes estén familiarizados con temas de álgebra lineal, cálculo, estadística, y tener conocimientos de al menos un lenguaje de programación (e.g. Python, R, Matlab, C++, u otros).
Programa del curso
Horario
- Lunes y miércoles, de 14:30 a 15:50 horas.
Office Hours
- Lunes y miércoles de 14:00 a 14:30, por solicitud del estudiante. También pueden enviar sus dudas por correo electrónico.
Material del curso
No. | Fecha | Tópicos | Recursos |
---|---|---|---|
01 | 06.01.2025 | Inicio del curso. ML y Data Science. Aula 01 |
|
02 | 13.01.2025 | Repaso de probabilidad y estadística. Probabilidad condicional. Aula 02 | aula02.ipynb |
03 | 15.01.2025 | Regla de Bayes. Distribuciones, densidad y función de distribución. Aula 03 | aula03.ipynb |
04 | 20.01.2025 | Ajuste de distribuciones. |
aula04.ipynb qqplots.ipynb distribuciones.ipynb data_aula04.csv |
05 | 22.01.2025 | Ejercicios de Fitting data. Exploración de datos. | aula05.ipynb |
T1 | 22.01.2025 | Tarea 1. Fecha de entrega: 30 de enero. |
Tarea 1 penguins.csv tips.csv |
06 | 27.01.2025 | Estadísticos. Covarianza y correlación. Aula 04 |
|
07 | 27.01.2025 | Centrado y normalización de datos. Normal multivariada. Aula 05 | center-data.ipynb multivariate.ipynb generate_gaussian.ipynb |
08 | 29.01.2025 | Análisis de Componentes Principales (PCA). Aula 06 |
|
09 | 03.02.2025 | Interpretación del PCA. Aula 07 |
deport.csv pca.ipynb |
10 | 05.02.2025 | Compresión de imágenes con PCA. Aula 08 |
SVD Compression Demo quetzal.png pca_imagen_basico.ipynb |
11 | 10.02.2025 | Escalamiento Multidimensional. Aula 09 |
md_scaling.ipynb |
12 | 12.02.2025 | Variables latentes. Descomposición NNMF. Sistemas de Recomendación. Aula 10 | movies.csv ratings.csv recommender.ipynb |
T2 | 17.02.2025 | Tarea 2. Fecha de entrega: 27 de febrero. |
Tarea 2 crimes.dat weather.csv |
13 | 17.02.2025 | Manifold learning I: Isomap, SNE y t-SNE, UMap. Aula 12 |
manifold-iris.ipynb manifold-roll.ipynb manifold-digits.ipynb |
14 | 19.02.2025 | Manifold learning II: SOM Aula 13 |
som-penguins.ipynb democracy-index.ipynb |
15 | 24.02.2025 | Construcción de densidades empíricas. Ventanas de Parzen. Aula 14 | |
16 | 26.02.2025 | Agrupamiento jerárquico. Aula 15 |
|
17 | 03.03.2025 | K-means, y variantes de K-means. Aula 16 |
|
18 | 05.03.2025 | Aplicaciones de K-means. Segmentación de imágenes. |
|
19 | 10.03.2025 | Otros métodos de agrupamiento. Aula 17 |
|
20 | 17.03.2025 | Métricas para evaluar métodos de agrupamiento. Aula 18 | |
21 | 24.03.2025 | Presentación del Primer Proyecto. | |
22 | 31.03.2025 | Indice de Dunn, índice de Davies-Bouldin. Método de las siluetas. | |
23 | 07.04.2025 | Modelación Predictiva. Error empírico y error de generalización. Complejidad. Aula 20 | |
24 | 09.04.2025 | K Nearest Neighbors (KNN). Aula 21 |
|
25 | 23.04.2025 | Clasificador bayesiano óptimo. Aula 22 |
|
26 | 28.04.2025 | Ejemplos de clasificador bayesiano. Naïve Bayes. Aula 22 | |
T3 | 30.04.2025 | Tarea 3. Fecha de entrega: 8 de mayo. |
Tarea 3 countries_binary.xlsx |
T4 | 30.04.2025 | Tarea 4. Fecha de entrega: 2 de mayo. |
Tarea 4 |
27 | 05.05.2025 | Regresión lineal: OLS, Matriz de diseño y ecuaciones normales. | |
28 | 07.05.2025 | Supuestos en OLS, pruebas de hipótesis, gráficos de diagnóstico. | |
29 | 12.05.2025 | Presentación de proyectos finales. | |
30 | 14.05.2025 | Presentación de proyectos finales. |
Proyectos
En el curso realizaremos dos proyectos.
Primer Proyecto
No. | Fecha | Tópicos |
---|---|---|
P1 | 26.02.2025 | Proyecto 1 Coordenadas de estaciones stations.json stations.csv |
. | 24-26.03.2025 | Presentaciones |
. | 28.03.2025 | Entrega del reporte, código y presentación |
Segundo Proyecto
No. | Fecha | Tópicos |
---|---|---|
P2 | 09.04.2025 | Proyecto 2 |
. | 28.04.2025 | Fecha límite para tener tema aprobado |
. | 12-16.05.2025 | Presentaciones |
. | 17.05.2025 | Entrega del código y presentación |
Referencias
Textos:
-
T. Hastie, R. Tibshirani, J. Friedman (2013). The Elements of Statistical Learning.
-
K. Murphy (2012). Machine Learning: a Probabilistic Perspective.