Aan de slagGa gratis aan de slag

Features standaardiseren

Het is belangrijk om de invoerkenmerken voor de kNN-afstandsberekening te standaardiseren met de functie scale(). Standaardisatie zorgt ervoor dat features met een grote gemiddelde waarde of variantie niet onevenredig veel invloed hebben op de kNN-afstandsscore.

Deze oefening maakt deel uit van de cursus

Introductie tot anomaliedetectie in R

Cursus bekijken

Oefeninstructies

  • Pas de functie summary() toe op de wine-gegevens om de gemiddelde, minimum- en maximumwaarden voor pH en alcohol te berekenen.
  • Gebruik de functie scale() om een gestandaardiseerde versie van de wine-gegevens te maken, genaamd wine_scaled.
  • Gebruik de functie summary() op wine_scaled om te controleren dat het gemiddelde en de bereiken zijn veranderd.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Without standardization, features have different scales
summary(wine)

# Standardize the wine columns
wine_scaled <- ___

# Standardized features have similar means and quartiles
___(___)
Code bewerken en uitvoeren