Ist die systematische Probenahme OK?
Bei der systematischen Stichprobenziehung gibt es ein Problem: Wenn die Daten sortiert wurden oder sich hinter der Reihenfolge der Zeilen ein Muster oder eine Bedeutung verbirgt, kann es sein, dass die resultierende Stichprobe nicht repräsentativ für die Grundgesamtheit ist. Das Problem kann gelöst werden, indem man die Zeilen mischt, aber dann ist die systematische Stichprobenziehung gleichbedeutend mit einer einfachen Zufallsstichprobenziehung.
Hier erfährst du, wie du feststellst, ob es ein Problem gibt oder nicht.
attrition_pop
verfügbar ist; pandas
wird als pd
geladen und matplotlib.pyplot
als plt
.
Diese Übung ist Teil des Kurses
Stichprobenziehung in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Add an index column to attrition_pop
attrition_pop_id = ____
# Plot YearsAtCompany vs. index for attrition_pop_id
____
plt.show()