Features standaardiseren
Het is belangrijk om de invoerkenmerken voor de kNN-afstandsberekening te standaardiseren met de functie scale(). Standaardisatie zorgt ervoor dat features met een grote gemiddelde waarde of variantie niet onevenredig veel invloed hebben op de kNN-afstandsscore.
Deze oefening maakt deel uit van de cursus
Introductie tot anomaliedetectie in R
Oefeninstructies
- Pas de functie
summary()toe op dewine-gegevens om de gemiddelde, minimum- en maximumwaarden voorpHenalcoholte berekenen. - Gebruik de functie
scale()om een gestandaardiseerde versie van dewine-gegevens te maken, genaamdwine_scaled. - Gebruik de functie
summary()opwine_scaledom te controleren dat het gemiddelde en de bereiken zijn veranderd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Without standardization, features have different scales
summary(wine)
# Standardize the wine columns
wine_scaled <- ___
# Standardized features have similar means and quartiles
___(___)