CommencerCommencer gratuitement

EDA sur les données d’analphabétisme/fertilité

Dans les prochains exercices, nous allons étudier la corrélation entre l’alphabétisation des femmes et la fécondité (définie comme le nombre moyen d’enfants par femme) dans le monde. Pour faciliter l’analyse et l’interprétation, nous travaillerons avec le taux d’analphabétisme.

Il est toujours judicieux de commencer par une EDA. À cette fin, tracez la fécondité en fonction de l’analphabétisme et calculez le coefficient de corrélation de Pearson. Le tableau NumPy illiteracy contient le taux d’analphabétisme des femmes pour la plupart des pays du monde. Le tableau fertility contient les données de fécondité correspondantes.

Ici, il peut être utile de revenir à la fonction que vous avez écrite dans le cours précédent pour calculer le coefficient de corrélation de Pearson.

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Tracez fertility (axe des y) en fonction de illiteracy (axe des x) sous forme de nuage de points.
  • Définissez une marge de 2 %.
  • Calculez et affichez le coefficient de corrélation de Pearson entre illiteracy et fertility.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')

# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')

# Show the plot
plt.show()

# Show the Pearson correlation coefficient
print(pearson_r(____, ____))
Modifier et exécuter le code