Examiner tc, ldl et hdl
Le jeu de données sur le diabète, dia, sera utilisé comme exemple réel pour ce chapitre et le suivant. Une bonne exploration des données est la base d’une simulation de Monte Carlo efficace ; vous allez donc poursuivre l’exploration dans les exercices !
Dans cet exercice, vous allez vous concentrer sur trois variables : tc, ldl et hdl. Le DataFrame dia a été chargé pour vous.
Les bibliothèques suivantes ont été importées pour vous : pandas sous le nom pd, numpy sous le nom np, matplotlib.pyplot sous le nom plt, et seaborn sous le nom sns.
Cet exercice fait partie du cours
Simulations de Monte Carlo en Python
Instructions
- Utilisez la fonction
pairplot()deseabornpour examiner visuellement la relation entre les colonnestc,ldlethdldansdia(dans cet ordre). - Utilisez la méthode
.corr()depandaspour mesurer les coefficients de corrélation entretc,ldlethdldansdia(dans cet ordre).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)