Ist die systematische Probenahme OK?
Bei der systematischen Stichprobenziehung gibt es ein Problem: Wenn die Daten sortiert wurden oder sich hinter der Reihenfolge der Zeilen ein Muster oder eine Bedeutung verbirgt, kann es sein, dass die resultierende Stichprobe nicht repräsentativ für die Grundgesamtheit ist. Das Problem kann gelöst werden, indem man die Zeilen mischt, aber dann ist die systematische Stichprobenziehung gleichbedeutend mit einer einfachen Zufallsstichprobenziehung.
Hier erfährst du, wie du feststellst, ob es ein Problem gibt oder nicht.
attrition_pop verfügbar ist; pandas wird als pd geladen und matplotlib.pyplot als plt.
Diese Übung ist Teil des Kurses
Stichprobenziehung in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add an index column to attrition_pop
attrition_pop_id = ____
# Plot YearsAtCompany vs. index for attrition_pop_id
____
plt.show()