Mulai sekarangMulai gratis

Membagi nilai ke dalam bin

Untuk banyak nilai kontinu, Anda mungkin kurang peduli pada nilai numerik persisnya, dan lebih peduli pada rentang (bucket) tempat nilai tersebut berada. Ini dapat berguna saat memvisualisasikan nilai, atau menyederhanakan model Machine Learning Anda. Teknik ini umumnya digunakan pada variabel kontinu ketika ketelitian bukan perhatian utama, misalnya usia, tinggi badan, atau upah.

Bin dibuat menggunakan pd.cut(df['column_name'], bins) di mana bins dapat berupa bilangan bulat yang menentukan jumlah bin berjarak sama, atau daftar batas bin.

Latihan ini merupakan bagian dari kursus

Rekayasa Fitur untuk Machine Learning di Python

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)

# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())
Edit dan Jalankan Kode