Escalando partes de um conjunto de dados
Nos vídeos anteriores, você usou o QuantileTransformer no conjunto de dados completo. Neste exercício, você vai praticar a padronização apenas de partes de um conjunto de dados. O motivo é que os conjuntos de ações têm features categóricas codificadas numericamente (day_of_week, day, month) que seriam escaladas incorretamente se você usasse o QuantileTransformer no conjunto completo.
O transformer foi importado do sklearn juntamente com o conjunto de dados de ações apple com as features extras.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Crie uma lista que contenha os cinco nomes de colunas numéricas de
apple. - Inicialize um
QuantileTransformerque converta as features para uma distribuição normal. - Escalone e armazene simultaneamente as cinco colunas em
to_scale.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a list of columns
to_scale = [____]
# Initialize a QuantileTransformer
qt = ____
# Scale and store simultaneously
apple.loc[____] = ____