IniziaInizia gratis

Standardizzare le feature

È importante assicurarsi che gli input delle feature per il calcolo della distanza kNN siano standardizzati usando la funzione scale(). La standardizzazione fa sì che le feature con media o varianza elevate non influenzino in modo sproporzionato il punteggio di distanza kNN.

Questo esercizio fa parte del corso

Introduzione all'Anomaly Detection in R

Visualizza il corso

Istruzioni dell'esercizio

  • Applica la funzione summary() ai dati wine per calcolare valori di media, minimo e massimo per pH e alcohol.
  • Usa la funzione scale() per creare una versione standardizzata dei dati wine chiamata wine_scaled.
  • Usa la funzione summary() su wine_scaled per verificare che la media e gli intervalli siano cambiati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Without standardization, features have different scales
summary(wine)

# Standardize the wine columns
wine_scaled <- ___

# Standardized features have similar means and quartiles
___(___)
Modifica ed esegui il codice