Evaluación de Set "Wine"

Este set contiene 14 variables químicas de vino hechos en una región de Italia, pero de 3 viñedos diferentes. Es un set bastante limpio sin datos faltantes.
No presenta un problema como tal, sino que provee datos que nos permiten encontrar estructuras y consistencias entre los vinos de cada viñedo, presentando un claro problema de clasificación, donde a partir de cualidades podemos tratar de inferir a que viñedo pertenecería.

Atributos

Atributo	Tipo	Descripción
Class	Categórico	Número del Viñedo del que proviene, atributo objetivo.
Alcohol	Real
Malicacid	Real
Ash	Real
Alcalinity_of_ash	Real
Magnesium	Entero
Total_phenols	Real
Flavanoids	Real
Nonflavanoid_phenols	Real
Proanthocyanins	Real
Color_intensity	Real
Hue	Real
0D280_0D315_of_diluted_wines	Real
Proline	Entero

Estadísticas y Distribuciones

Pelican
Pelican
Pelican

Proceso Utilizado y Resultados

Pelican

Las particiones son automáticas y dividen en conjuntos de 70/30 los datos, para entrenar y testear respectivamente.

Para datos sin normalizar

Pelican

Para datos normalizados

Pelican

Conclusiones

Se denota una mayor precisión de clasificación en los datos que nos normalizados previamente a entrenar al modelo, una diferencia considerable (aproximadamente 10%).
Esto se puede deber a que el modelo entrenarse con datos distribuidos en rangos similares, logra encontrar estructuras específicas mejor, por lo que es mejor clasificando, mientras que datos con rangos muy diferentes le es más difícil inferir características específicas.

Portfolio de Intro a Aprendizaje Automático por Rafael Alonso