Diskretisasi suatu variabel
Untuk membuat predictor insight graph bagi variabel kontinu, Anda terlebih dahulu perlu mendiskretkannya. Di Python, Anda dapat mendiskretkan kolom pandas menggunakan metode qcut.
Untuk memeriksa apakah variabel sudah terdiskretisasi dengan baik, Anda dapat memastikan bahwa setiap bin memiliki ukuran yang sama menggunakan metode groupby:
print(basetable.groupby("discretized_variable").size()
Latihan ini adalah bagian dari kursus
Pengantar Predictive Analytics dengan Python
Petunjuk latihan
- Gunakan metode
qcutuntuk mendiskretkan variabeltime_since_last_donationke dalam 10 kelompok. Tetapkan variabel ini ke kolom baru bernama "bins_recency". - Gunakan metode
groupbyuntuk memverifikasi bahwa setiap bin memiliki ukuran yang kurang lebih sama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)
# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())