Verwacht aantal tellingen berekenen
In de vorige oefeningen heb je het gemiddelde en de variantie van de crab-gegevens berekend en vastgesteld dat die niet gelijk zijn. In deze oefening oefen je een andere analyse voor overdispersie: je gebruikt het al berekende gemiddelde en berekent het verwachte aantal tellingen voor een bepaalde waarde, bijvoorbeeld nul-tellingen. Met andere woorden: hoeveel nul satellieten mogen we in de steekproef verwachten, gegeven het berekende steekproefgemiddelde?
Kijk nog eens naar de figuur uit de crab-gegevensset, waar je veel nul-tellingen ziet.

Onthoud dat je het verwachte aantal tellingen, gegeven de parameter, kunt berekenen met de gedefinieerde Poissonverdeling, gegeven door
$$ P(y)=\frac{\lambda^ye^{-\lambda}}{y!} $$
De crab-gegevensset en het berekende gemiddelde sat_mean zijn al voor je ingeladen in de werkruimte.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Gebruik het berekende gemiddelde
sat_meanen de nul-tellingen \(y = 0\) om het verwachte aantal nul-tellingen te berekenen. Gebruikmathfactorial(). - Bereken het aantal observaties met nul-tellingen in de variabele
satmetsum()en het totale aantal observaties in de steekproef metlen(). - Print de verhouding tussen het werkelijke aantal observaties met nul-tellingen en het totale aantal observaties.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Expected number of zero counts
exp_zero_cnt = ((____**____)*np.____(-____))/math.____(____)
# Print exp_zero_counts
print('Expected zero counts given mean of ', round(____,3),
'is ', round(____,3)*100)
# Number of zero counts in sat variable
actual_zero_cnt = sum(____[____] == 0)
# Number of observations in crab dataset
num_obs = len(____)
# Print the percentage of zero count observations in the sample
print('Actual zero counts in the sample: ', round(____ / ____,3)*100)