Kategorik özelliklerle regresyon
Artık her şarkının türü için ikili özellikler içeren music_dummies'ı oluşturdun; şimdi şarkı popülerliğini tahmin etmek için bir ridge regresyon modeli kurma zamanı.
music_dummies, Ridge, cross_val_score, numpy (np olarak) ve kf olarak saklanan bir KFold nesnesi senin için önceden yüklendi.
Model, ortalama RMSE hesaplanarak değerlendirilecek; ancak önce, her kat için skorları pozitif değerlere çevirmen ve kareköklerini alman gerekiyor. Bu metrik, modelimizin tahminlerinin ortalama hatasını gösterir; böylece hedef değişkenin standart sapması—"popularity"—ile karşılaştırılabilir.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
music_dummiesiçindeki tüm özellikleri barındıranX'i ve"popularity"sütunundan oluşany'yi oluştur.alphadeğerini 0.2 yaparak bir ridge regresyon modeli başlat.- Ridge modelini kullanarak
Xveyüzerinde çapraz doğrulama yap;cvdeğerinikfolarak ayarla ve skorlama metriği olarak negatif ortalama kare hatasını kullan. - Negatif
scoresdeğerlerini pozitife çevirip kareköklerini alarak RMSE değerlerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create X and y
X = ____
y = ____
# Instantiate a ridge model
ridge = ____
# Perform cross-validation
scores = ____(____, ____, ____, cv=____, scoring="____")
# Calculate RMSE
rmse = np.____(____)
print("Average RMSE: {}".format(np.mean(rmse)))
print("Standard Deviation of the target array: {}".format(np.std(y)))