ComeçarComece de graça

Padronizando variáveis

É importante garantir que as variáveis de entrada para o cálculo de distância do kNN estejam padronizadas usando a função scale(). A padronização assegura que variáveis com média ou variância maiores não influenciem desproporcionalmente a pontuação de distância do kNN.

Este exercício faz parte do curso

Introduction to Anomaly Detection in R

Ver curso

Instruções do exercício

  • Aplique a função summary() aos dados wine para calcular os valores de média, mínimo e máximo de pH e alcohol.
  • Use a função scale() para criar uma versão padronizada dos dados wine chamada wine_scaled.
  • Use a função summary() em wine_scaled para verificar que as médias e os intervalos mudaram.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Without standardization, features have different scales
summary(wine)

# Standardize the wine columns
wine_scaled <- ___

# Standardized features have similar means and quartiles
___(___)
Editar e executar o código