Erzeugen einer Bootstrap-Verteilung
Das Verfahren zur Erstellung einer Bootstrap-Verteilung ähnelt dem Verfahren zur Erstellung einer Stichprobenverteilung; nur der erste Schritt ist anders.
Um eine Stichprobenverteilung zu erstellen, beginnst du mit der Grundgesamtheit und nimmst eine Stichprobe ohne Zurücklegen. Um eine Bootstrap-Verteilung zu erstellen, beginnst du mit einer Stichprobe und nimmst eine Stichprobe mit Zurücklegen. Danach sind die Schritte dieselben: Berechne die zusammenfassende Statistik, an der du interessiert bist, für diese Stichprobe/Wiederholungsstichprobe und wiederhole den Prozess viele Male. In jedem Fall kannst du die Verteilung mit einem Histogramm visualisieren.
Hier ist spotify_sample
eine Teilmenge des spotify_population
Datensatzes. Um leichter zu sehen, wie das Resampling funktioniert, wurde eine Zeilenindexspalte mit dem Namen 'index'
hinzugefügt und nur die Spalten Künstlername, Songname und danceability
wurden aufgenommen.
spotify_sample
ist verfügbar; pandas
, numpy
und matplotlib.pyplot
werden mit ihren üblichen Aliasen geladen.
Diese Übung ist Teil des Kurses
Stichprobenziehung in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)