CommencerCommencer gratuitement

Examiner tc, ldl et hdl

Le jeu de données sur le diabète, dia, sera utilisé comme exemple réel pour ce chapitre et le suivant. Une bonne exploration des données est la base d’une simulation de Monte Carlo efficace ; vous allez donc poursuivre l’exploration dans les exercices !

Dans cet exercice, vous allez vous concentrer sur trois variables : tc, ldl et hdl. Le DataFrame dia a été chargé pour vous.

Les bibliothèques suivantes ont été importées pour vous : pandas sous le nom pd, numpy sous le nom np, matplotlib.pyplot sous le nom plt, et seaborn sous le nom sns.

Cet exercice fait partie du cours

Simulations de Monte Carlo en Python

Afficher le cours

Instructions

  • Utilisez la fonction pairplot() de seaborn pour examiner visuellement la relation entre les colonnes tc, ldl et hdl dans dia (dans cet ordre).
  • Utilisez la méthode .corr() de pandas pour mesurer les coefficients de corrélation entre tc, ldl et hdl dans dia (dans cet ordre).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()

# Calculate correlation coefficients
print(____)
Modifier et exécuter le code