Mulai sekarangMulai gratis

Diskretisasi suatu variabel

Untuk membuat predictor insight graph bagi variabel kontinu, Anda terlebih dahulu perlu mendiskretkannya. Di Python, Anda dapat mendiskretkan kolom pandas menggunakan metode qcut.

Untuk memeriksa apakah variabel sudah terdiskretisasi dengan baik, Anda dapat memastikan bahwa setiap bin memiliki ukuran yang sama menggunakan metode groupby:

print(basetable.groupby("discretized_variable").size()

Latihan ini merupakan bagian dari kursus

Pengantar Predictive Analytics dengan Python

Lihat Kursus

Instruksi latihan

  • Gunakan metode qcut untuk mendiskretkan variabel time_since_last_donation ke dalam 10 kelompok. Tetapkan variabel ini ke kolom baru bernama "bins_recency".
  • Gunakan metode groupby untuk memverifikasi bahwa setiap bin memiliki ukuran yang kurang lebih sama.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)

# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())
Edit dan Jalankan Kode