Verilerin nasıl görünüyor? (I)
Şimdiye kadar yeni özellikler oluşturmaya ve verilerindeki sorunlarla uğraşmaya odaklandın. Özellik mühendisliği, elindeki veriden en iyi şekilde yararlanmak ve Machine Learning modelleri oluştururken onu daha etkili kullanmak için de kullanılabilir.
Birçok algoritma, verinin normal dağıldığını ya da en azından tüm sütunların aynı ölçekte olduğunu varsayabilir. Bu durum çoğu zaman geçerli değildir; örneğin bir özellik binlerce dolar cinsinden ölçülürken bir diğeri yıl sayısı olabilir. Bu egzersizde, so_survey_df DataFrame'inden türetilen ve so_numeric_df içinde saklanan bazı sayısal sütunların dağılımlarını incelemek için grafikleri oluşturacaksın.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning için Özellik Mühendisliği
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a histogram
____
plt.show()