tc, ldl en hdl onderzoeken
De diabetesgegevensset, dia, wordt gebruikt als realistisch voorbeeld voor zowel dit hoofdstuk als het volgende. Een goede data-exploratie is de basis voor effectieve Monte Carlo-simulaties, dus je gaat hiermee verder in de oefeningen!
In deze oefening focus je op drie variabelen: tc, ldl en hdl. De dia DataFrame is voor je geladen.
De volgende libraries zijn voor je geïmporteerd: pandas als pd, numpy als np, matplotlib.pyplot als plt en seaborn als sns.
Deze oefening maakt deel uit van de cursus
Monte Carlo-simulaties in Python
Oefeninstructies
- Gebruik de functie
pairplot()inseabornom de relatie tussen de kolommentc,ldlenhdlindiavisueel te onderzoeken (in die volgorde). - Gebruik de methode
.corr()uitpandasom de correlatiecoëfficiënten tussentc,ldlenhdlindiate berekenen (in die volgorde).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)