kNN-afstandsscore visualiseren
De kNN-afstandsscore is lastig te interpreteren door alleen naar de waarden te kijken. Het is handig om scatterplots te gebruiken om de kNN-afstandsscore te visualiseren en zo te begrijpen hoe de score werkt. Bij het interpreteren van de plot is de relatieve grootte van de kNN-afstandsscore informatiever dan de absolute waarde.
De wine-gegevens zijn geladen met de kNN-afstandsscore toegevoegd vanuit de vorige oefening.
Deze oefening maakt deel uit van de cursus
Introductie tot anomaliedetectie in R
Oefeninstructies
- Gebruik een scatterplot om
pHenalcoholop hun oorspronkelijke schalen te tonen. - Geef een geschikte waarde aan het
cex-argument zodat elk punt in grootte evenredig is met de vierkantswortel van descore. - Pas het tekentekenargument
pchaan zodat punten als massieve bolletjes worden weergegeven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Scatterplot showing pH, alcohol and kNN score
plot(pH ~ alcohol, ___, cex = ___, pch = ___)