EDA su alfabetizzazione/fertilità
Nei prossimi esercizi analizzeremo la correlazione tra alfabetizzazione femminile e fertilità (definita come il numero medio di figli per donna) a livello mondiale. Per facilitare l’analisi e l’interpretazione, lavoreremo con il tasso di analfabetismo.
È sempre una buona pratica fare un po’ di EDA prima dell’analisi. A questo scopo, traccia la fertilità in funzione dell’analfabetismo e calcola il coefficiente di correlazione di Pearson. L’array NumPy illiteracy contiene il tasso di analfabetismo femminile per la maggior parte delle nazioni del mondo. L’array fertility contiene i dati di fertilità corrispondenti.
Qui può esserti utile tornare alla function you wrote in the previous course per calcolare il coefficiente di correlazione di Pearson.
Questo esercizio fa parte del corso
Pensiero statistico in Python (Parte 2)
Istruzioni dell'esercizio
- Disegna
fertility(asse y) in funzione diilliteracy(asse x) come grafico a dispersione. - Imposta un margine del 2%.
- Calcola e stampa il coefficiente di correlazione di Pearson tra
illiteracyefertility.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')
# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')
# Show the plot
plt.show()
# Show the Pearson correlation coefficient
print(pearson_r(____, ____))