Visualisierung eines Datensatzes zum Zuckergehalt
In dieser Übung erstellst du ein eindimensionales Streudiagramm mit 25 Messwerten zum Zuckergehalt von Softdrinks. Ziel ist es, deutliche Cluster im Datensatz zu visualisieren – als erster Schritt, um mögliche Entscheidungsgrenzen zu identifizieren.
Der Datensatz mit 25 Zuckergehaltsmessungen befindet sich in der Spalte sugar_content des Dataframes df, das bereits für dich geladen wurde.
Diese Übung ist Teil des Kurses
<Kurs>Support Vector Machines in R</Kurs>Übungsanweisungen
- Lade das Paket
ggplot2. - Liste die Variablen im Dataframe
dfauf. - Vervollständige den Code für das Streudiagramm. Verwende den Datensatz
df, um die Zuckergehalte entlang der x‑Achse (bei y gleich null) zu plotten. - Schreibe
ggplot()-Code, um den Zuckergehalt indfals Streudiagramm darzustellen. Erkennst du zwei klar unterscheidbare Cluster, die Proben mit hohem bzw. niedrigem Zuckergehalt entsprechen?
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Load ggplot2
___
# Print variable names
___
# Plot sugar content along the x-axis
plot_df <- ggplot(data = __, aes(x = ___, y = ___)) +
geom_point() +
geom_text(aes(label = sugar_content), size = 2.5, vjust = 2, hjust = 0.5)
# Display plot
plot_df