Escalar datos - estandarizar columnas
Como sabemos que las columnas Ash
, Alcalinity of ash
, y Magnesium
del conjunto de datos wine
están todas en escalas diferentes, vamos a normalizarlas de forma que se puedan utilizar en un modelo lineal.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Importa la clase
StandardScaler
. - Instanciar un
StandardScaler()
y almacenarlo en la variable,scaler
. - Crea un subconjunto del DataFrame
wine
que contenga las columnasAsh
,Alcalinity of ash
, yMagnesium
, asígnalo awine_subset
. - Ajusta y transforma el escalador estándar a
wine_subset
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)