Dimensionando dados - padronizando colunas
Como sabemos que as colunas Ash, Alcalinity of ash e Magnesium no conjunto de dados wine estão em escalas diferentes, vamos padronizá-las de um jeito que permita o uso em um modelo linear.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Importe a classe
StandardScaler. - Instancie um
StandardScaler()e armazene na variávelscaler. - Crie um subconjunto do DataFrame
winecontendo as colunasAsh,Alcalinity of asheMagnesium, e atribua awine_subset. - Faça o ajuste e a transformação (fit e transform) do standard scaler em
wine_subset.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import StandardScaler
from sklearn.preprocessing import ____
# Create the scaler
scaler = ____
# Subset the DataFrame you want to scale
____ = wine[[____]]
# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)