Einfaches Sampling mit dplyr
In diesem Kapitel arbeitest du mit Song-Daten von Spotify. Jede Zeile des Datensatzes steht für einen Song, insgesamt gibt es 41656 Zeilen. Die Spalten enthalten unter anderem den Songtitel, die Künstler:innen, das Erscheinungsjahr sowie Eigenschaften wie Dauer, Tempo und Tanzbarkeit. Wir starten mit den Dauern.
Deine erste Aufgabe ist, den Song-Datensatz zu sampeln und eine Berechnung auf der gesamten Grundgesamtheit mit derselben Berechnung auf einer Stichprobe zu vergleichen.
spotify_population ist verfügbar und dplyr ist geladen.
Diese Übung ist Teil des Kurses
Stichprobenerhebung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# View the whole population dataset
___
# Sample 1000 rows from spotify_population
spotify_sample <- ___
# See the result
spotify_sample