Değerleri bölmelere ayırma (binning)
Birçok sürekli değerde, sayısal bir sütunun tam değerinden çok, hangi aralığa (bölmeye) düştüğüyle ilgilenirsin. Bu, değerleri görselleştirirken ya da Machine Learning modellerini basitleştirirken işe yarar. Genellikle doğruluğun en büyük öncelik olmadığı sürekli değişkenlerde kullanılır; örneğin yaş, boy, ücretler.
Bölmeler pd.cut(df['column_name'], bins) ile oluşturulur; burada bins eşit aralıklı bölme sayısını belirleyen bir tamsayı ya da bölme sınırlarını içeren bir listedir.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)
# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())