Einfaches Sampling mit dplyr

In diesem Kapitel arbeitest du mit Song-Daten von Spotify. Jede Zeile des Datensatzes steht für einen Song, insgesamt gibt es 41656 Zeilen. Die Spalten enthalten unter anderem den Songtitel, die Künstler:innen, das Erscheinungsjahr sowie Eigenschaften wie Dauer, Tempo und Tanzbarkeit. Wir starten mit den Dauern.

Deine erste Aufgabe ist, den Song-Datensatz zu sampeln und eine Berechnung auf der gesamten Grundgesamtheit mit derselben Berechnung auf einer Stichprobe zu vergleichen.

spotify_population ist verfügbar und dplyr ist geladen.

Diese Übung ist Teil des Kurses

<Kurs>Stichprobenerhebung in R</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# View the whole population dataset
___

# Sample 1000 rows from spotify_population
spotify_sample <- ___


# See the result
spotify_sample

Code bearbeiten und ausführen