Comece agoraComece grátis

Padronizando variáveis

É importante garantir que as variáveis de entrada para o cálculo de distância do kNN estejam padronizadas usando a função scale(). A padronização assegura que variáveis com média ou variância maiores não influenciem desproporcionalmente a pontuação de distância do kNN.

Este exercicio faz parte do curso

Introduction to Anomaly Detection in R

Ver curso

Instruções do exercicio

  • Aplique a função summary() aos dados wine para calcular os valores de média, mínimo e máximo de pH e alcohol.
  • Use a função scale() para criar uma versão padronizada dos dados wine chamada wine_scaled.
  • Use a função summary() em wine_scaled para verificar que as médias e os intervalos mudaram.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Without standardization, features have different scales
summary(wine)

# Standardize the wine columns
wine_scaled <- ___

# Standardized features have similar means and quartiles
___(___)
Editar e Executar Código