tc, ldl und hdl untersuchen
Der Diabetes-Datensatz dia wird sowohl in diesem als auch im nächsten Kapitel als Praxisbeispiel verwendet. Eine gründliche Datenexploration ist die Basis für wirksame Monte-Carlo-Simulationen – deshalb setzt du die Erkundung der Daten in den Übungen fort!
In dieser Übung konzentrierst du dich auf drei Variablen: tc, ldl und hdl. Das dia-DataFrame wurde für dich geladen.
Die folgenden Bibliotheken wurden für dich importiert: pandas als pd, numpy als np, matplotlib.pyplot als plt und seaborn als sns.
Diese Übung ist Teil des Kurses
Monte-Carlo-Simulationen in Python
Anleitung zur Übung
- Verwende die Funktion
pairplot()inseaborn, um die Beziehung zwischen den Spaltentc,ldlundhdlindia(in genau dieser Reihenfolge) visuell zu untersuchen. - Verwende die Methode
.corr()auspandas, um die Korrelationskoeffizienten zwischentc,ldlundhdlindiazu berechnen (ebenfalls in genau dieser Reihenfolge).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)