y, tc und cdl untersuchen
Jetzt konzentrierst du dich auf tc, hdl und y, um den Zusammenhang zwischen einigen unabhängigen Variablen und der abhängigen Variable, dem Krankheitsverlauf, zu verstehen. Der Diabetes-Datensatz wurde als DataFrame dia geladen.
Später im Kurs wirst du mithilfe einer Simulation den Einfluss von Prädiktoren auf Antworten messen. Ein erstes Verständnis der Beziehungen zwischen Variablen hilft dir dabei, deine Simulationsergebnisse später besser einzuordnen!
Die folgenden Bibliotheken wurden für dich importiert: pandas als pd, numpy als np, matplotlib.pyplot als plt und seaborn als sns.
Diese Übung ist Teil des Kurses
<Kurs>Monte-Carlo-Simulationen in Python</Kurs>Übungsanweisungen
- Verwende
.pairplot(), umtc,hdlundyindiavisuell zu untersuchen. - Miss die Korrelationskoeffizienten zwischen
tc,hdlundyindia.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a pairplot of tc, hdl, and y
____
plt.show()
# Calculate correlation coefficients
print(____)