ComeçarComece de graça

Dimensionando dados - padronizando colunas

Como sabemos que as colunas Ash, Alcalinity of ash e Magnesium no conjunto de dados wine estão em escalas diferentes, vamos padronizá-las de um jeito que permita o uso em um modelo linear.

Este exercício faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercício

  • Importe a classe StandardScaler.
  • Instancie um StandardScaler() e armazene na variável scaler.
  • Crie um subconjunto do DataFrame wine contendo as colunas Ash, Alcalinity of ash e Magnesium, e atribua a wine_subset.
  • Faça o ajuste e a transformação (fit e transform) do standard scaler em wine_subset.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import StandardScaler
from sklearn.preprocessing import ____

# Create the scaler
scaler = ____

# Subset the DataFrame you want to scale 
____ = wine[[____]]

# Apply the scaler to wine_subset
wine_subset_scaled = scaler.____(____)
Editar e executar o código