Description

A diferencia de las diferentes formas de estadística, donde los modelos se utilizan para comprender los datos, el modelado predictivo se centra en el desarrollo de modelos que hacen las predicciones más precisas a expensas de explicar el por qué se hacen las predicciones. A diferencia del campo más amplio de minería de datos que podría usarse con datos en cualquier formato, el modelado predictivo se enfoca principalmente en datos tabulares (por ejemplo, tablas de números como una hoja de cálculo). En este contexto, el curso pretende otorgar a los estudiantes los conceptos básicos e intermedios relacionados al análisis y tratamiento de datos pero llevando este proceso más allá pudiendo aplicar algoritmos basados en aprendizaje, es decir, Machine Learning. Para ello, el curso hará uso de un sistema muy utilizado en cualquier ámbito y línea de investigación como es Weka, plataforma de software libre y gratuito muy intuitiva y potente.
Information

Learning Units

The course will develop the following learning units: (1) To learn the techniques of data preprocessing for machine learning; (2) To understand what data mining is and apply it to a specific data set; (3) To understand and to analyze the preprocessing phase in machine learning; (4) To understand and to analyze the phase of algorithmic modeling in machine learning; (5) To understand and to analyze the tuning phase for the different machine learning models; and (6) To develop and analyze machine learning projects such as regression, classification and multiclass.

Topics

1

Introduction: (1). Basic concepts of machine learning; and (2) Weka Workbench as our machine learning environment.

2

Data mining in Weka: (1) Panels in Weka; and (2) Knowing our data in the Weka panels.

3

Pre-analysis and pre-processing of data: (1) Classification of data; (2) Data set for machine learning; and (3) Pre-analysis of data.



4

Pre-processing of data for machine learning: (1) Normalization and standardization of data; (2) Transform the data; and (3) Handle lost values ​​in the data.

5

Data analysis in machine learning: (1) Future Selection; (2) Use of machine learning algorithms; (3) Estimate the result of the algorithms; and (4) Estimate a baseline of the results.

6

Modeling phase in machine learning: (1) Classification algorithms; (2) Regression algorithms; and (3) Ensemble algorithms.



7

Phase 'Tuning' in machine learning: (1) Compare the performance of the algorithms; (2) 'Tunning' the parameters (hyperparameters) of the algorithms; and (3) Save our models and make predictions.

8

Projects in machine learning: (1) Work on a multiclass classification project; (2) Work on a binary classification project; and (3) Work on a regression project.