Membagi nilai ke dalam bin
Untuk banyak nilai kontinu, Anda mungkin kurang peduli pada nilai numerik persisnya, dan lebih peduli pada rentang (bucket) tempat nilai tersebut berada. Ini dapat berguna saat memvisualisasikan nilai, atau menyederhanakan model Machine Learning Anda. Teknik ini umumnya digunakan pada variabel kontinu ketika ketelitian bukan perhatian utama, misalnya usia, tinggi badan, atau upah.
Bin dibuat menggunakan pd.cut(df['column_name'], bins) di mana bins dapat berupa bilangan bulat yang menentukan jumlah bin berjarak sama, atau daftar batas bin.
Latihan ini merupakan bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)
# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())