Esaminare y, tc e cdl
Ora concentrati su tc, hdl e y, per capire la relazione tra alcune variabili indipendenti e quella dipendente, la progressione della malattia. L’insieme di dati sul diabete è stato caricato come DataFrame dia.
Più avanti nel corso userai una simulazione per misurare l’impatto dei predittori sulle risposte, quindi avere una comprensione iniziale delle relazioni tra le variabili ti aiuterà a interpretare i risultati della simulazione!
Le seguenti librerie sono già state importate per te: pandas come pd, numpy come np, matplotlib.pyplot come plt e seaborn come sns.
Questo esercizio fa parte del corso
Simulazioni Monte Carlo in Python
Istruzioni dell'esercizio
- Usa
.pairplot()per esaminare visivamentetc,hdleyindia. - Misura i coefficienti di correlazione tra
tc,hdleyindia.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a pairplot of tc, hdl, and y
____
plt.show()
# Calculate correlation coefficients
print(____)