Menguji tc, ldl, dan hdl
Himpunan data diabetes, dia, akan digunakan sebagai contoh dunia nyata untuk bab ini dan bab berikutnya. Eksplorasi data yang tepat adalah dasar untuk melakukan simulasi Monte Carlo yang efektif, sehingga Anda akan terus mengeksplorasi data dalam latihan ini!
Pada latihan ini, Anda akan berfokus pada tiga variabel: tc, ldl, dan hdl. DataFrame dia telah dimuat untuk Anda.
Pustaka berikut telah diimpor untuk Anda: pandas sebagai pd, numpy sebagai np, matplotlib.pyplot sebagai plt, dan seaborn sebagai sns.
Latihan ini adalah bagian dari kursus
Simulasi Monte Carlo di Python
Petunjuk latihan
- Gunakan fungsi
pairplot()diseabornuntuk meninjau secara visual hubungan antara kolomtc,ldl, danhdldalamdia(ditentukan dalam urutan tersebut). - Gunakan metode
.corr()daripandasuntuk mengukur koefisien korelasi antaratc,ldl, danhdldalamdia(ditentukan dalam urutan tersebut).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)