LoslegenKostenlos loslegen

Einfaches Sampling mit dplyr

In diesem Kapitel arbeitest du mit Song-Daten von Spotify. Jede Zeile des Datensatzes steht für einen Song, insgesamt gibt es 41656 Zeilen. Die Spalten enthalten unter anderem den Songtitel, die Künstler:innen, das Erscheinungsjahr sowie Eigenschaften wie Dauer, Tempo und Tanzbarkeit. Wir starten mit den Dauern.

Deine erste Aufgabe ist, den Song-Datensatz zu sampeln und eine Berechnung auf der gesamten Grundgesamtheit mit derselben Berechnung auf einer Stichprobe zu vergleichen.

spotify_population ist verfügbar und dplyr ist geladen.

Diese Übung ist Teil des Kurses

Stichprobenerhebung in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# View the whole population dataset
___

# Sample 1000 rows from spotify_population
spotify_sample <- ___


# See the result
spotify_sample
Code bearbeiten und ausführen