Elements of Machine Learning 2024
Este es un curso introductorio al aprendizaje estadístico, con énfasis principalmente en los fundamentos matemáticos y estadísticos de los principales algoritmos de aprendizaje automático y reconocimiento de patrones. El tema central del curso es el estudio de métodos para obtener información útil a partir de datos. Abordamos temas principales como el aprendizaje supervisado y no supervisado, los modelos de regresión, y algunos tópicos recientes como el aprendizaje profundo. Al final del curso, los estudiantes comprederán los fundamentos de los algoritmos más populares del aprendizaje estadístico. Para aprovechar de mejor manera el curso, es recomendable que los estudiantes estén familiarizados con temas de álgebra lineal, cálculo, estadística, y tener conocimientos de al menos un lenguaje de programación (e.g. Python, R, Matlab, C++, u otros).
Programa del curso
Horario
- Viernes, de 13:00 a 15:50 horas.
Office Hours
- Viernes de 12:00 a 13:00 horas, por solicitud del estudiante. También pueden enviar sus dudas por correo electrónico.
Material del curso
No. | Fecha | Tópicos | Recursos |
---|---|---|---|
01 | 12.01.2024 | Introducción al curso. ML y Data Science. Aula 01 |
|
02 | 19.01.2024 | Generación de muestras aleatorias. Repaso de estadística. | aula02a_.ipynb aula02b_.ipynb |
T1 | 19.01.2024 | Tarea 1. | tarea01.pdf Entrega: viernes 2 de febrero. |
05 | 26.01.2024 | Análisis de Componentes Principales (PCA). Aula 05 |
center-data.ipynb svd.ipynb |
06 | 26.01.2024 | Interpretación del PCA. Aula 06 |
pca.ipynb deport.csv |
07 | 02.02.2024 | Escalamiento multidimensional. Aula 07 |
md-scaling.ipynb |
08 | 02.02.2024 | PCA para compresión de imágenes. Aula 08 |
pca-grayscale.ipynb pca-RGB.ipynb quetzal.png |
09 | http://timbaumann.info/svd-image-compression-demo/ | ||
T2 | 02.02.2024 | Tarea 2. | tarea02.pdf crimes.dat distances.csv weather.csv Entrega: viernes 16 de febrero. |
10 | 16.02.2024 | Factoración NNMF. Sistemas de recomendación. Aula 10 | recommender.ipynb movies.csv ratings.csv |
11 | 23.02.2024 | Manifold Learning I. Aula 11 |
manifold-roll.ipynb manifold-digits.ipynb |
12 | 23.02.2024 | Manifold Learning II. Aula 12 |
som-penguins.ipynb democracy-index.csv democracy-index.ipynb |
13 | 01.03.2024 | Imputación de Datos. Aula 13 |
imputation.ipynb visualisation.ipynb hpi-data-2016.csv |
14 | 01.03.2024 | Estimación de Densidades por Kernel (KDE). Aula 14 | 1D-kernel-density.ipynb 2D-kernel-density.ipynb |
T3 | 08.03.2024 | Tarea 3. | tarea03.pdf hpi-data-2016.csv wines.csv Entrega: viernes 22 de marzo. |
15 | 08.03.2024 | Agrupamiento Jerárquico. Aula 15 |
hierarchical.ipynb hierarchical-image.ipynb tree.jpg playa.jpeg |
16 | 08.03.2024 | Ejemplos de agrupamiento jerárquico. |
countries_binary.xlsx |
16 | 15.03.2024 | K-means y variantes. Aula 16 |
k-means_data.csv |
17 | 22.03.2024 | Ejercicio usando K-means. |
ejercicio.pdf |
18 | 05.04.2024 | Otros algoritmos de clustering: Mean-shift, DBSCAN, OPTICS, BIRCH. Aula 17 |
density-based.ipynb compare-clust.ipynb |
19 | 05.04.2024 | Métricas para agrupamiento. Aula 18 |
clustering-metrics.ipynb silhouette.ipynb ejercicio-clust.ipynb Datos_clustering.csv |
20 | 12.04.2024 | Presentaciones del primer proyecto. | |
21 | 26.04.2024 | Modelación predictiva. K-nearest neighbours (KNN). Aula 19 |
|
22 | 26.04.2024 | Clasificador bayesiano óptimo. Aula 20 Aula 21 |
Clasificador_Bayesiano.xlsx |
23 | 03.05.2024 | Naïve Bayes. Ejemplos de clasificadores naïve. | bayes.ipynb bayes_car_exercise.ipynb bayes_text_class.ipynb car_data.csv |
T4 | 03.05.2024 | Tarea 4. | tarea04.pdf golf_data.csv |
24 | 10.05.2024 | Redes Neuronales. Aula 24 |
Keras1.zip |
25 | 17.05.2024 | Presentación de proyecto final. |
Proyectos
En el curso realizaremos dos proyectos.
Primer Proyecto (Ecobici y SP500)
No. | Fecha | Tópicos |
---|---|---|
P1 | 23.02.2024 | Proyecto 1 Coordenadas de estaciones stations.json stations.csv |
. | 12.04.2024 | Presentaciones |
. | 12.04.2024 | Entrega del reporte, código y presentación |
Segundo Proyecto (Tema Libre)
No. | Fecha | Tópicos |
---|---|---|
P2 | 26.04.2024 | Proyecto 2 |
. | 17.05.2024 | Presentaciones |
. | 19.05.2024 | Entrega del reporte, código y presentación |
Material adicional (scripts)
No. | Fecha | Tópicos | Material |
---|---|---|---|
00 | 12.01.2024 | Instalación de librerías y ambiente de trabajo Python Anaconda, Jupyter-lab. | Anaconda+Tensorflow+Jupyter installation guide Archivos auxiliares: plotmatrix.py test.ipynb |
Referencias
Textos:
-
T. Hastie, R. Tibshirani, J. Friedman (2013). The Elements of Statistical Learning.
-
K. Murphy (2012). Machine Learning: a Probabilistic Perspective.