Standardizzare le feature
È importante assicurarsi che gli input delle feature per il calcolo della distanza kNN siano standardizzati usando la funzione scale(). La standardizzazione fa sì che le feature con media o varianza elevate non influenzino in modo sproporzionato il punteggio di distanza kNN.
Questo esercizio fa parte del corso
Introduzione all'Anomaly Detection in R
Istruzioni dell'esercizio
- Applica la funzione
summary()ai datiwineper calcolare valori di media, minimo e massimo perpHealcohol. - Usa la funzione
scale()per creare una versione standardizzata dei datiwinechiamatawine_scaled. - Usa la funzione
summary()suwine_scaledper verificare che la media e gli intervalli siano cambiati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Without standardization, features have different scales
summary(wine)
# Standardize the wine columns
wine_scaled <- ___
# Standardized features have similar means and quartiles
___(___)