Erzeugen einer Bootstrap-Verteilung
Das Verfahren zur Erstellung einer Bootstrap-Verteilung ähnelt dem Verfahren zur Erstellung einer Stichprobenverteilung; nur der erste Schritt ist anders.
Um eine Stichprobenverteilung zu erstellen, beginnst du mit der Grundgesamtheit und nimmst eine Stichprobe ohne Zurücklegen. Um eine Bootstrap-Verteilung zu erstellen, beginnst du mit einer Stichprobe und nimmst eine Stichprobe mit Zurücklegen. Danach sind die Schritte dieselben: Berechne die zusammenfassende Statistik, an der du interessiert bist, für diese Stichprobe/Wiederholungsstichprobe und wiederhole den Prozess viele Male. In jedem Fall kannst du die Verteilung mit einem Histogramm visualisieren.
Hier ist spotify_sample
eine Teilmenge des spotify_population
Datensatzes. Um leichter zu sehen, wie das Resampling funktioniert, wurde eine Zeilenindexspalte mit dem Namen 'index'
hinzugefügt und nur die Spalten Künstlername, Songname und danceability
wurden aufgenommen.
spotify_sample
ist verfügbar; pandas
, numpy
und matplotlib.pyplot
werden mit ihren üblichen Aliasen geladen.
Diese Übung ist Teil des Kurses
Stichprobenziehung in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)