Skip to content

Latest commit

 

History

History
101 lines (39 loc) · 3.18 KB

File metadata and controls

101 lines (39 loc) · 3.18 KB

Big Data for Public and Private Sectors (Parte 2)

Este repositorio contiene los materiales de la segunda parte de los cursos "Big Data for Public and Private Sectors" e "Introduction to Data Science", ofrecidos en la Universidad del Rosario en junio de 2017 y 2018. En esta segunda parte cubrimos los principales modelos de machine learning supervisado. Cada sección contiene la explicación teórica de los modelos, seguida de aplicaciones computacionales en R. Buena parte del material se basa en capítulos de los libros de Lantz (2015) y James et. al (2013).

Profesor: Jorge Gallego

1. Introducción

Syllabus

Introducción (slides)

2. Clasificación Usando Vecinos más Cercanos

Vecinos más Cercanos kNN (Slides)

Vecinos más Cercanos kNN en R (Guía)

wisc_bc_data.csv (Base de Datos)

3. Naive Bayes

Naive Bayes (Slides)

Naive Bayes en R (Guía)

votos84.csv (Base de Datos)

4. Support Vector Machine

Support Vector Machine (Slides)

Support Vector Machine en R (Guía)

letterdata.csv (Base de Datos)

5. Árboles de Decisión

Árboles de Decisión (Slides)

Árboles de Decisión en R (Guía)

credit.csv (Base de Datos)

6. Random Forests

Random Forest (Slides)

Random Forests en R (Guía)

bank.csv (Base de Datos)

7. Métodos de Predicción: Regresión

Regresión Lineal y Logit (Slides)

Regresión Lineal y Logit en R (Guía)

insurance.csv (Base de Datos)

8. RIDGE y LASSO

Regresiones RIDGE y LASSO (Slides)

Regresiones RIDGE y LASSO en R (Guía)

Hitters.csv

9. Desempeño de Modelos

Desempeño de Modelos (Slides)

Desempeño de Modelos en R (Guía)

bank.csv

bank_sample.csv