Relatieve fouten berekenen
De grootte van de steekproef die je neemt, bepaalt hoe nauwkeurig de puntschattingen het bijbehorende populatieparameter weergeven. Als je bijvoorbeeld een steekproefgemiddelde berekent, wil je dat dit dicht bij het populatiegemiddelde ligt. Is je steekproef echter te klein, dan hoeft dat niet zo te zijn.
De meest gebruikte maat voor nauwkeurigheid is de relatieve fout. Dit is het absolute verschil tussen het populatieparameter en de puntschatting, gedeeld door het populatieparameter. Dit wordt soms uitgedrukt als een percentage.
attrition_pop en mean_attrition_pop (het gemiddelde van de kolom Attrition van attrition_pop) zijn beschikbaar; pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Steekproeven in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate a simple random sample of 50 rows, with seed 2022
attrition_srs50 = ____
# Calculate the mean employee attrition in the sample
mean_attrition_srs50 = ____
# Calculate the relative error percentage
rel_error_pct50 = ____
# Print rel_error_pct50
print(rel_error_pct50)