Examiner y, tc et cdl
Vous allez maintenant vous concentrer sur tc, hdl et y, afin de comprendre la relation entre quelques variables indépendantes et la variable dépendante, la progression de la maladie. Le jeu de données diabetes a été chargé dans le DataFrame dia.
Plus tard dans le cours, vous utiliserez une simulation pour mesurer l’impact des prédicteurs sur les réponses. Avoir au préalable une première compréhension des relations entre variables vous aidera à interpréter les résultats de votre simulation !
Les bibliothèques suivantes ont été importées pour vous : pandas sous pd, numpy sous np, matplotlib.pyplot sous plt et seaborn sous sns.
Cet exercice fait partie du cours
Simulations de Monte Carlo en Python
Instructions
- Utilisez
.pairplot()pour examiner visuellementtc,hdletydansdia. - Mesurez les coefficients de corrélation entre
tc,hdletydansdia.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a pairplot of tc, hdl, and y
____
plt.show()
# Calculate correlation coefficients
print(____)