Standardizasyon için özellikleri belirleme
Bu egzersizde, UFO veri kümesindeki sütunların varyansını inceleyerek hangi özelliklerin standardize edilmesi gerektiğini belirleyeceksin. seconds ve minutes sütunlarının varyanslarına baktıktan sonra, seconds sütununun varyansının aşırı yüksek olduğunu göreceksin. seconds ve minutes birbiriyle ilişkili olduğundan (modelleme için özellik seçerken ele alacağımız bir konu), hadi seconds sütununu log normalize edelim.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
secondsveminutessütunlarındaki varyansı hesapla ve sonuçlara yakından bak.secondssütununda log normalizasyonu uygula ve bunuseconds_logadlı yeni bir sütuna dönüştür.seconds_logsütununun varyansını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Check the variance of the seconds and minutes columns
print(____)
# Log normalize the seconds column
ufo["seconds_log"] = ____
# Print out the variance of just the seconds_log column
print(____)