BaşlayınÜcretsiz başlayın

Standardizasyon için özellikleri belirleme

Bu egzersizde, UFO veri kümesindeki sütunların varyansını inceleyerek hangi özelliklerin standardize edilmesi gerektiğini belirleyeceksin. seconds ve minutes sütunlarının varyanslarına baktıktan sonra, seconds sütununun varyansının aşırı yüksek olduğunu göreceksin. seconds ve minutes birbiriyle ilişkili olduğundan (modelleme için özellik seçerken ele alacağımız bir konu), hadi seconds sütununu log normalize edelim.

Bu egzersiz, kursun bir parçasıdır

Python'da Machine Learning için Ön İşleme

Kursa Göz Atın

Egzersiz talimatları

  • seconds ve minutes sütunlarındaki varyansı hesapla ve sonuçlara yakından bak.
  • seconds sütununda log normalizasyonu uygula ve bunu seconds_log adlı yeni bir sütuna dönüştür.
  • seconds_log sütununun varyansını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Check the variance of the seconds and minutes columns
print(____)

# Log normalize the seconds column
ufo["seconds_log"] = ____

# Print out the variance of just the seconds_log column
print(____)
Kodu Düzenle ve Çalıştır