MulaiMulai sekarang secara gratis

Diskretisasi suatu variabel

Untuk membuat predictor insight graph bagi variabel kontinu, Anda terlebih dahulu perlu mendiskretkannya. Di Python, Anda dapat mendiskretkan kolom pandas menggunakan metode qcut.

Untuk memeriksa apakah variabel sudah terdiskretisasi dengan baik, Anda dapat memastikan bahwa setiap bin memiliki ukuran yang sama menggunakan metode groupby:

print(basetable.groupby("discretized_variable").size()

Latihan ini adalah bagian dari kursus

Pengantar Predictive Analytics dengan Python

Lihat Kursus

Petunjuk latihan

  • Gunakan metode qcut untuk mendiskretkan variabel time_since_last_donation ke dalam 10 kelompok. Tetapkan variabel ini ke kolom baru bernama "bins_recency".
  • Gunakan metode groupby untuk memverifikasi bahwa setiap bin memiliki ukuran yang kurang lebih sama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)

# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())
Edit dan Jalankan Kode