Examiner tc, ldl et hdl
Le jeu de données sur le diabète, dia, sera utilisé comme exemple réel pour ce chapitre et le suivant. Une bonne exploration des données est la base d’une simulation de Monte Carlo efficace ; vous allez donc poursuivre l’exploration dans les exercices !
Dans cet exercice, vous allez vous concentrer sur trois variables : tc, ldl et hdl. Le DataFrame dia a été chargé pour vous.
Les bibliothèques suivantes ont été importées pour vous : pandas sous le nom pd, numpy sous le nom np, matplotlib.pyplot sous le nom plt, et seaborn sous le nom sns.
Cet exercice fait partie du cours
<cours>Simulations de Monte Carlo en Python</cours>Instructions de l’exercice
- Utilisez la fonction
pairplot()deseabornpour examiner visuellement la relation entre les colonnestc,ldlethdldansdia(dans cet ordre). - Utilisez la méthode
.corr()depandaspour mesurer les coefficients de corrélation entretc,ldlethdldansdia(dans cet ordre).
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)