Este repositorio contiene los materiales de la segunda parte de los cursos "Big Data for Public and Private Sectors" e "Introduction to Data Science", ofrecidos en la Universidad del Rosario en junio de 2017 y 2018. En esta segunda parte cubrimos los principales modelos de machine learning supervisado. Cada sección contiene la explicación teórica de los modelos, seguida de aplicaciones computacionales en R. Buena parte del material se basa en capítulos de los libros de Lantz (2015) y James et. al (2013).
Vecinos más Cercanos kNN (Slides)
Vecinos más Cercanos kNN en R (Guía)
wisc_bc_data.csv (Base de Datos)
Support Vector Machine (Slides)
Support Vector Machine en R (Guía)
letterdata.csv (Base de Datos)
Árboles de Decisión en R (Guía)
Regresión Lineal y Logit (Slides)
Regresión Lineal y Logit en R (Guía)
Regresiones RIDGE y LASSO (Slides)
Regresiones RIDGE y LASSO en R (Guía)