ComeçarComece gratuitamente

Dimensionamento de dados - padronização de colunas

Como sabemos que as colunas Ash, Alcalinity of ash e Magnesium no conjunto de dados wine estão todas em escalas diferentes, vamos padronizá-las de forma a permitir o uso em um modelo linear.

Este exercício faz parte do curso

Pré-processamento para aprendizado de máquina em Python

Ver Curso

Instruções de exercício

  • Importe a classe StandardScaler.
  • Instanciar um StandardScaler() e armazená-lo na variável scaler.
  • Crie um subconjunto do DataFrame wine que contenha as colunas Ash, Alcalinity of ash e Magnesium e atribua-o a wine_subset.
  • Ajuste e transforme o escalonador padrão para wine_subset.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)
Editar e executar código