Verilerin nasıl görünüyor? (I)
Şimdiye kadar yeni özellikler oluşturmaya ve verilerindeki sorunlarla uğraşmaya odaklandın. Özellik mühendisliği, elindeki veriden en iyi şekilde yararlanmak ve Machine Learning modelleri oluştururken onu daha etkili kullanmak için de kullanılabilir.
Birçok algoritma, verinin normal dağıldığını ya da en azından tüm sütunların aynı ölçekte olduğunu varsayabilir. Bu durum çoğu zaman geçerli değildir; örneğin bir özellik binlerce dolar cinsinden ölçülürken bir diğeri yıl sayısı olabilir. Bu egzersizde, so_survey_df DataFrame'inden türetilen ve so_numeric_df içinde saklanan bazı sayısal sütunların dağılımlarını incelemek için grafikleri oluşturacaksın.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a histogram
____
plt.show()