Aan de slagGa gratis aan de slag

Is systematisch steekproeven OK?

Systematisch steekproeven heeft een probleem: als de data is gesorteerd, of er zit een patroon of betekenis in de rijvolgorde, dan is de resulterende steekproef mogelijk niet representatief voor de hele populatie. Dit probleem kun je oplossen door de rijen te schudden, maar dan is systematisch steekproeven gelijk aan eenvoudig aselect steekproeven.

Hier bekijk je hoe je kunt bepalen of er wel of geen probleem is.

attrition_pop is beschikbaar; pandas is geladen als pd, en matplotlib.pyplot als plt.

Deze oefening maakt deel uit van de cursus

Steekproeven in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Add an index column to attrition_pop
attrition_pop_id = ____

# Plot YearsAtCompany vs. index for attrition_pop_id
____
plt.show()
Code bewerken en uitvoeren