Descripción

A diferencia de las diferentes formas de estadística, donde los modelos se utilizan para comprender los datos, el modelado predictivo se centra en el desarrollo de modelos que hacen las predicciones más precisas a expensas de explicar el por qué se hacen las predicciones. A diferencia del campo más amplio de minería de datos que podría usarse con datos en cualquier formato, el modelado predictivo se enfoca principalmente en datos tabulares (por ejemplo, tablas de números como una hoja de cálculo). En este contexto, el curso pretende otorgar a los estudiantes los conceptos básicos e intermedios relacionados al análisis y tratamiento de datos pero llevando este proceso más allá pudiendo aplicar algoritmos basados en aprendizaje, es decir, Machine Learning. Para ello, el curso hará uso de un sistema muy utilizado en cualquier ámbito y línea de investigación como es Weka, plataforma de software libre y gratuito muy intuitiva y potente.
Información

Unidades de aprendizaje

El curso desarrollará las siguiente unidades de aprendizaje: (1) Aprender las técnicas de preprocesamiento de datos para machine learning; (2) Comprender qué es la minería de datos y aplicarla a un conjunto de datos específico; (3) Comprender y analizar la fase de preprocesamiento en machine learning; (4) Comprender y analizar la fase de modelado algorítmico en machine learning; (5) Comprender y analizar la fase de tunníng para los diferentes modelos de machine learning; y (6) Desarrollar y analizar proyectos de machine learning como regresión, clasificación y multiclase.

Temas

1

Introducción: (1). Conceptos básicos de machine learning; y (2) Weka Workbench como nuestro entorno de machine learning.

2

Minería de datos en Weka: (1) Paneles en Weka; y (2) Conociendo nuestros datos en los paneles de Weka.

3

Pre-análisis y pre-tratamiento de datos: (1) Clasificación de datos en machine learning; (2) Conjunto de datos para machine learning; y (3) Pre-análisis de datos.



4

Pre-procesamiento de datos para machine learning: (1) Normalización y estandarización de los datos; (2) Transformar los datos; y (3) Manejar valores perdidos en los datos.

5

Análisis de datos en machine learning: (1) Future Selection en machine learning; (2) Uso de algoritmos de machine learning; (3) Estimar el resultado de los algoritmos; y (4) Estimar una línea base de los resultados.

6

Fase de modelado en machine learning: (1) Algoritmos de clasificación; (2) Algoritmos de regresión; y (3) Algoritmos ensamblados.



7

Fase ‘Tuning’ en machine learning: (1) Comparar el rendimiento de los algoritmos; (2) ‘Tunear’ los parámetros (hiperparámetros) de los algoritmos; y (3) Guardar nuestros modelos y hacer predicciones.

8

Proyectos en machine learning: (1) Trabajar un proyecto de clasificación multiclase; (2) Trabajar un proyecto de clasificación binario; y (3) Trabajar un proyecto de regresión.