Calcolo del numero atteso di conteggi
Negli esercizi precedenti hai calcolato la media e la varianza dei dati sui granchi e hai visto che non sono uguali. In questo esercizio metterai in pratica un'altra analisi per l'overdispersion usando la media già calcolata e determinando il numero atteso di conteggi per un certo valore, ad esempio i conteggi pari a zero. In altre parole, quanti zeri nei satelliti dovremmo aspettarci nel campione, data la media campionaria calcolata.
Ricorda la figura dal dataset crab, dove si nota un gran numero di conteggi pari a zero.

Ricorda che per calcolare il numero atteso di conteggi dato il parametro puoi usare la distribuzione di Poisson, definita come
$$ P(y)=\frac{\lambda^ye^{-\lambda}}{y!} $$
Il dataset crab e la media calcolata sat_mean sono già caricati nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Istruzioni dell'esercizio
- Usando la media calcolata
sat_meane i conteggi zero \(y = 0\), calcola il numero atteso di conteggi pari a zero. Usamathfactorial(). - Calcola il numero di osservazioni con conteggio zero nella variabile
satusandosum()e il numero totale di osservazioni nel campione usandolen(). - Stampa il rapporto tra il numero effettivo di zeri e il numero totale di osservazioni.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Expected number of zero counts
exp_zero_cnt = ((____**____)*np.____(-____))/math.____(____)
# Print exp_zero_counts
print('Expected zero counts given mean of ', round(____,3),
'is ', round(____,3)*100)
# Number of zero counts in sat variable
actual_zero_cnt = sum(____[____] == 0)
# Number of observations in crab dataset
num_obs = len(____)
# Print the percentage of zero count observations in the sample
print('Actual zero counts in the sample: ', round(____ / ____,3)*100)