Een gegevensset met suikergehalte visualiseren
In deze oefening maak je een eendimensionale spreidingsplot van 25 metingen van het suikergehalte in frisdrank. Het doel is om afzonderlijke clusters in de gegevensset te visualiseren als eerste stap richting het vinden van mogelijke beslissingsgrenzen.
De gegevensset met 25 suikergehaltemetingen staat in de kolom sugar_content van de data frame df, die al voor je is ingeladen.
Deze oefening maakt deel uit van de cursus
Support Vector Machines in R
Oefeninstructies
- Laad het package
ggplot2. - Toon de variabelen in data frame
df. - Maak de code voor de spreidingsplot af. Gebruik de gegevensset
dfen zet het suikergehalte van de monsters op de x-as (bij y gelijk aan nul). - Schrijf
ggplot()-code om het suikergehalte indfals een spreidingsplot weer te geven. Kun je twee duidelijke clusters zien die overeenkomen met monsters met hoog en laag suikergehalte?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load ggplot2
___
# Print variable names
___
# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) +
geom_point() +
geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)
# Display plot
plot_df