Diskretisasi suatu variabel
Untuk membuat predictor insight graph bagi variabel kontinu, Anda terlebih dahulu perlu mendiskretkannya. Di Python, Anda dapat mendiskretkan kolom pandas menggunakan metode qcut.
Untuk memeriksa apakah variabel sudah terdiskretisasi dengan baik, Anda dapat memastikan bahwa setiap bin memiliki ukuran yang sama menggunakan metode groupby:
print(basetable.groupby("discretized_variable").size()
Latihan ini merupakan bagian dari kursus
Pengantar Predictive Analytics dengan Python
Instruksi latihan
- Gunakan metode
qcutuntuk mendiskretkan variabeltime_since_last_donationke dalam 10 kelompok. Tetapkan variabel ini ke kolom baru bernama "bins_recency". - Gunakan metode
groupbyuntuk memverifikasi bahwa setiap bin memiliki ukuran yang kurang lebih sama.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)
# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())