Dimensionamento de dados - padronização de colunas
Como sabemos que as colunas Ash
, Alcalinity of ash
e Magnesium
no conjunto de dados wine
estão todas em escalas diferentes, vamos padronizá-las de forma a permitir o uso em um modelo linear.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Importe a classe
StandardScaler
. - Instanciar um
StandardScaler()
e armazená-lo na variávelscaler
. - Crie um subconjunto do DataFrame
wine
que contenha as colunasAsh
,Alcalinity of ash
eMagnesium
e atribua-o awine_subset
. - Ajuste e transforme o escalonador padrão para
wine_subset
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)