Test d'ipotesi sulla correlazione di Pearson
La correlazione osservata tra analfabetismo femminile e fertilità potrebbe essere dovuta al caso; la fertilità di un dato Paese potrebbe in realtà essere del tutto indipendente dal suo livello di analfabetismo. Metterai alla prova questa ipotesi. Per farlo, permuta i valori di analfabetismo lasciando fissi quelli di fertilità. In questo modo simuli l'ipotesi che siano completamente indipendenti tra loro. Per ogni permutazione, calcola il coefficiente di correlazione di Pearson e verifica quante delle tue repliche per permutazione hanno un coefficiente di Pearson maggiore di quello osservato.
La funzione pearson_r() che hai scritto nel prequel di questo corso per calcolare il coefficiente di correlazione di Pearson è già a tua disposizione.
Questo esercizio fa parte del corso
Pensiero statistico in Python (Parte 2)
Istruzioni dell'esercizio
- Calcola la correlazione di Pearson osservata tra
illiteracyefertility. - Inizializza un array per memorizzare le tue repliche per permutazione.
- Scrivi un ciclo
forper generare 10.000 repliche:- Permuta le misurazioni di
illiteracyusandonp.random.permutation(). - Calcola la correlazione di Pearson tra l'array di analfabetismo permutato,
illiteracy_permuted, efertility.
- Permuta le misurazioni di
- Calcola e stampa il p-value ottenuto dalle repliche.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute observed correlation: r_obs
r_obs = ____
# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)
# Draw replicates
for ____ in ____:
# Permute illiteracy measurments: illiteracy_permuted
illiteracy_permuted = ____
# Compute Pearson correlation
perm_replicates[i] = ____
# Compute p-value: p
p = ____
print('p-val =', p)