Membagi nilai ke dalam bin
Untuk banyak nilai kontinu, Anda mungkin kurang peduli pada nilai numerik persisnya, dan lebih peduli pada rentang (bucket) tempat nilai tersebut berada. Ini dapat berguna saat memvisualisasikan nilai, atau menyederhanakan model Machine Learning Anda. Teknik ini umumnya digunakan pada variabel kontinu ketika ketelitian bukan perhatian utama, misalnya usia, tinggi badan, atau upah.
Bin dibuat menggunakan pd.cut(df['column_name'], bins) di mana bins dapat berupa bilangan bulat yang menentukan jumlah bin berjarak sama, atau daftar batas bin.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)
# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())