CommencerCommencez gratuitement

Examiner y, tc et cdl

Vous allez maintenant vous concentrer sur tc, hdl et y, afin de comprendre la relation entre quelques variables indépendantes et la variable dépendante, la progression de la maladie. Le jeu de données diabetes a été chargé dans le DataFrame dia.

Plus tard dans le cours, vous utiliserez une simulation pour mesurer l’impact des prédicteurs sur les réponses. Avoir au préalable une première compréhension des relations entre variables vous aidera à interpréter les résultats de votre simulation !

Les bibliothèques suivantes ont été importées pour vous : pandas sous pd, numpy sous np, matplotlib.pyplot sous plt et seaborn sous sns.

Cet exercice fait partie du cours

<cours>Simulations de Monte Carlo en Python</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez .pairplot() pour examiner visuellement tc, hdl et y dans dia.
  • Mesurez les coefficients de corrélation entre tc, hdl et y dans dia.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create a pairplot of tc, hdl, and y
____
plt.show()

# Calculate correlation coefficients
print(____)
Modifier et exécuter le code