IniziaInizia gratis

Test d'ipotesi sulla correlazione di Pearson

La correlazione osservata tra analfabetismo femminile e fertilità potrebbe essere dovuta al caso; la fertilità di un dato Paese potrebbe in realtà essere del tutto indipendente dal suo livello di analfabetismo. Metterai alla prova questa ipotesi. Per farlo, permuta i valori di analfabetismo lasciando fissi quelli di fertilità. In questo modo simuli l'ipotesi che siano completamente indipendenti tra loro. Per ogni permutazione, calcola il coefficiente di correlazione di Pearson e verifica quante delle tue repliche per permutazione hanno un coefficiente di Pearson maggiore di quello osservato.

La funzione pearson_r() che hai scritto nel prequel di questo corso per calcolare il coefficiente di correlazione di Pearson è già a tua disposizione.

Questo esercizio fa parte del corso

Pensiero statistico in Python (Parte 2)

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola la correlazione di Pearson osservata tra illiteracy e fertility.
  • Inizializza un array per memorizzare le tue repliche per permutazione.
  • Scrivi un ciclo for per generare 10.000 repliche:
    • Permuta le misurazioni di illiteracy usando np.random.permutation().
    • Calcola la correlazione di Pearson tra l'array di analfabetismo permutato, illiteracy_permuted, e fertility.
  • Calcola e stampa il p-value ottenuto dalle repliche.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Compute observed correlation: r_obs
r_obs = ____

# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)

# Draw replicates
for ____ in ____:
    # Permute illiteracy measurments: illiteracy_permuted
    illiteracy_permuted = ____

    # Compute Pearson correlation
    perm_replicates[i] = ____

# Compute p-value: p
p = ____
print('p-val =', p)
Modifica ed esegui il codice