Erzeugen einer Bootstrap-Verteilung
Das Verfahren zur Erstellung einer Bootstrap-Verteilung ähnelt dem Verfahren zur Erstellung einer Stichprobenverteilung; nur der erste Schritt ist anders.
Um eine Stichprobenverteilung zu erstellen, beginnst du mit der Grundgesamtheit und nimmst eine Stichprobe ohne Zurücklegen. Um eine Bootstrap-Verteilung zu erstellen, beginnst du mit einer Stichprobe und nimmst eine Stichprobe mit Zurücklegen. Danach sind die Schritte dieselben: Berechne die zusammenfassende Statistik, an der du interessiert bist, für diese Stichprobe/Wiederholungsstichprobe und wiederhole den Prozess viele Male. In jedem Fall kannst du die Verteilung mit einem Histogramm visualisieren.
Hier ist spotify_sample eine Teilmenge des spotify_population Datensatzes. Um leichter zu sehen, wie das Resampling funktioniert, wurde eine Zeilenindexspalte mit dem Namen 'index' hinzugefügt und nur die Spalten Künstlername, Songname und danceability wurden aufgenommen.
spotify_sample ist verfügbar; pandas, numpy und matplotlib.pyplot werden mit ihren üblichen Aliasen geladen.
Diese Übung ist Teil des Kurses
Stichprobenziehung in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)