Visualisierung eines Datensatzes zum Zuckergehalt
In dieser Übung erstellst du ein eindimensionales Streudiagramm mit 25 Messwerten zum Zuckergehalt von Softdrinks. Ziel ist es, deutliche Cluster im Datensatz zu visualisieren – als erster Schritt, um mögliche Entscheidungsgrenzen zu identifizieren.
Der Datensatz mit 25 Zuckergehaltsmessungen befindet sich in der Spalte sugar_content des Dataframes df, das bereits für dich geladen wurde.
Diese Übung ist Teil des Kurses
Support Vector Machines in R
Anleitung zur Übung
- Lade das Paket
ggplot2. - Liste die Variablen im Dataframe
dfauf. - Vervollständige den Code für das Streudiagramm. Verwende den Datensatz
df, um die Zuckergehalte entlang der x‑Achse (bei y gleich null) zu plotten. - Schreibe
ggplot()-Code, um den Zuckergehalt indfals Streudiagramm darzustellen. Erkennst du zwei klar unterscheidbare Cluster, die Proben mit hohem bzw. niedrigem Zuckergehalt entsprechen?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load ggplot2
___
# Print variable names
___
# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) +
geom_point() +
geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)
# Display plot
plot_df