MulaiMulai sekarang secara gratis

Membagi nilai ke dalam bin

Untuk banyak nilai kontinu, Anda mungkin kurang peduli pada nilai numerik persisnya, dan lebih peduli pada rentang (bucket) tempat nilai tersebut berada. Ini dapat berguna saat memvisualisasikan nilai, atau menyederhanakan model Machine Learning Anda. Teknik ini umumnya digunakan pada variabel kontinu ketika ketelitian bukan perhatian utama, misalnya usia, tinggi badan, atau upah.

Bin dibuat menggunakan pd.cut(df['column_name'], bins) di mana bins dapat berupa bilangan bulat yang menentukan jumlah bin berjarak sama, atau daftar batas bin.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk Machine Learning di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)

# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())
Edit dan Jalankan Kode