Değerleri bölmelere ayırma (binning)
Birçok sürekli değerde, sayısal bir sütunun tam değerinden çok, hangi aralığa (bölmeye) düştüğüyle ilgilenirsin. Bu, değerleri görselleştirirken ya da Machine Learning modellerini basitleştirirken işe yarar. Genellikle doğruluğun en büyük öncelik olmadığı sürekli değişkenlerde kullanılır; örneğin yaş, boy, ücretler.
Bölmeler pd.cut(df['column_name'], bins) ile oluşturulur; burada bins eşit aralıklı bölme sayısını belirleyen bir tamsayı ya da bölme sınırlarını içeren bir listedir.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning için Özellik Mühendisliği
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)
# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())