BaşlayınÜcretsiz başlayın

Değerleri bölmelere ayırma (binning)

Birçok sürekli değerde, sayısal bir sütunun tam değerinden çok, hangi aralığa (bölmeye) düştüğüyle ilgilenirsin. Bu, değerleri görselleştirirken ya da Machine Learning modellerini basitleştirirken işe yarar. Genellikle doğruluğun en büyük öncelik olmadığı sürekli değişkenlerde kullanılır; örneğin yaş, boy, ücretler.

Bölmeler pd.cut(df['column_name'], bins) ile oluşturulur; burada bins eşit aralıklı bölme sayısını belirleyen bir tamsayı ya da bölme sınırlarını içeren bir listedir.

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning için Özellik Mühendisliği

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Bin the continuous variable ConvertedSalary into 5 bins
so_survey_df['equal_binned'] = ____(so_survey_df['ConvertedSalary'], ____)

# Print the first 5 rows of the equal_binned column
print(so_survey_df[['equal_binned', 'ConvertedSalary']].head())
Kodu Düzenle ve Çalıştır