Esaminare tc, ldl e hdl
Il dataset sul diabete, dia, sarà l'esempio reale sia per questo capitolo sia per il prossimo. Un'esplorazione accurata dei dati è la base per eseguire Monte Carlo simulations efficaci, quindi nei prossimi esercizi continuerai ad analizzare i dati!
In questo esercizio ti concentrerai su tre variabili: tc, ldl e hdl. Il DataFrame dia è già stato caricato per te.
Sono già state importate le seguenti librerie: pandas come pd, numpy come np, matplotlib.pyplot come plt e seaborn come sns.
Questo esercizio fa parte del corso
Simulazioni Monte Carlo in Python
Istruzioni dell'esercizio
- Usa la funzione
pairplot()diseabornper esaminare visivamente la relazione tra le colonnetc,ldlehdlindia(in quell'ordine). - Usa il metodo
.corr()dipandasper misurare i coefficienti di correlazione tratc,ldlehdlindia(in quell'ordine).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)