Verwacht aantal tellingen berekenen

In de vorige oefeningen heb je het gemiddelde en de variantie van de crab-gegevens berekend en vastgesteld dat die niet gelijk zijn. In deze oefening oefen je een andere analyse voor overdispersie: je gebruikt het al berekende gemiddelde en berekent het verwachte aantal tellingen voor een bepaalde waarde, bijvoorbeeld nul-tellingen. Met andere woorden: hoeveel nul satellieten mogen we in de steekproef verwachten, gegeven het berekende steekproefgemiddelde?

Kijk nog eens naar de figuur uit de crab-gegevensset, waar je veel nul-tellingen ziet.

Onthoud dat je het verwachte aantal tellingen, gegeven de parameter, kunt berekenen met de gedefinieerde Poissonverdeling, gegeven door

$$ P(y)=\frac{\lambda^ye^{-\lambda}}{y!} $$

De crab-gegevensset en het berekende gemiddelde sat_mean zijn al voor je ingeladen in de werkruimte.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Bekijk cursus

Oefeninstructies

Gebruik het berekende gemiddelde sat_mean en de nul-tellingen $y = 0$ om het verwachte aantal nul-tellingen te berekenen. Gebruik math factorial().
Bereken het aantal observaties met nul-tellingen in de variabele sat met sum() en het totale aantal observaties in de steekproef met len().
Print de verhouding tussen het werkelijke aantal observaties met nul-tellingen en het totale aantal observaties.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Expected number of zero counts
exp_zero_cnt = ((____**____)*np.____(-____))/math.____(____)

# Print exp_zero_counts
print('Expected zero counts given mean of ', round(____,3), 
      'is ', round(____,3)*100)

# Number of zero counts in sat variable
actual_zero_cnt = sum(____[____]  == 0)

# Number of observations in crab dataset
num_obs = len(____)

# Print the percentage of zero count observations in the sample
print('Actual zero counts in the sample: ', round(____ / ____,3)*100)

Code bewerken en uitvoeren