BaşlayınÜcretsiz Başlayın

Kategorik özelliklerle regresyon

Artık her şarkının türü için ikili özellikler içeren music_dummies'ı oluşturdun; şimdi şarkı popülerliğini tahmin etmek için bir ridge regresyon modeli kurma zamanı.

music_dummies, Ridge, cross_val_score, numpy (np olarak) ve kf olarak saklanan bir KFold nesnesi senin için önceden yüklendi.

Model, ortalama RMSE hesaplanarak değerlendirilecek; ancak önce, her kat için skorları pozitif değerlere çevirmen ve kareköklerini alman gerekiyor. Bu metrik, modelimizin tahminlerinin ortalama hatasını gösterir; böylece hedef değişkenin standart sapması—"popularity"—ile karşılaştırılabilir.

Bu egzersiz

scikit-learn ile Supervised Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • music_dummies içindeki tüm özellikleri barındıran X'i ve "popularity" sütunundan oluşan y'yi oluştur.
  • alpha değerini 0.2 yaparak bir ridge regresyon modeli başlat.
  • Ridge modelini kullanarak X ve y üzerinde çapraz doğrulama yap; cv değerini kf olarak ayarla ve skorlama metriği olarak negatif ortalama kare hatasını kullan.
  • Negatif scores değerlerini pozitife çevirip kareköklerini alarak RMSE değerlerini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create X and y
X = ____
y = ____

# Instantiate a ridge model
ridge = ____

# Perform cross-validation
scores = ____(____, ____, ____, cv=____, scoring="____")

# Calculate RMSE
rmse = np.____(____)
print("Average RMSE: {}".format(np.mean(rmse)))
print("Standard Deviation of the target array: {}".format(np.std(y)))
Kodu Düzenle ve Çalıştır