y, tc en cdl onderzoeken
Nu richt je je op tc, hdl en y om de relatie te begrijpen tussen een paar onafhankelijke variabelen en de afhankelijke variabele, de ziekteprogressie. De diabetesgegevensset is geladen als de DataFrame dia.
Later in de cursus gebruik je een simulatie om de impact van voorspellers op responsen te meten. Een eerste inzicht in de relaties tussen variabelen helpt je straks om je simulatieresultaten beter te begrijpen!
De volgende libraries zijn alvast voor je geïmporteerd: pandas als pd, numpy als np, matplotlib.pyplot als plt en seaborn als sns.
Deze oefening maakt deel uit van de cursus
Monte Carlo-simulaties in Python
Oefeninstructies
- Gebruik
.pairplot()omtc,hdlenyindiavisueel te verkennen. - Meet de correlatiecoëfficiënten tussen
tc,hdlenyindia.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a pairplot of tc, hdl, and y
____
plt.show()
# Calculate correlation coefficients
print(____)