Görülmüş vs. görülmemiş veri
Modeller, daha önce gördükleri gözlemlerde genellikle daha yüksek doğruluğa sahiptir. Şeker verisinde, Skittles'ın popülerliğini tahmin etmek, Andes Mints'in popülerliğini tahmin etmekten muhtemelen daha doğru olacaktır; çünkü Skittles veri kümesinde var, Andes Mints yok.
X_train veri kümesini kullanarak 50 şeker üzerinden bir model kurdun ve modelin, kurulduğu 50 şekerin popülerliğini ve hiç görmediği 35 şekerin (X_test) popülerliğini ne kadar doğru tahmin ettiğini raporlaman gerekiyor. Doğruluk metriği olarak ortalama mutlak hata mae() kullanacaksın.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- Girdi verisi olarak
X_trainveX_testi kullanarak,model.predict()ile tahmin dizileri oluştur. - Modelin, daha önce gördüğü ve daha önce görmediği veriler üzerindeki doğruluğunu hesapla.
- Görülmüş ve görülmemiş veriyi yazdırmak için print ifadelerini kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# The model is fit using X_train and y_train
model.fit(X_train, y_train)
# Create vectors of predictions
train_predictions = model.predict(____)
test_predictions = model.predict(____)
# Train/Test Errors
train_error = mae(y_true=y_train, y_pred=____)
test_error = mae(y_true=y_test, y_pred=____)
# Print the accuracy for seen and unseen data
print("Model error on seen data: {0:.2f}.".format(____))
print("Model error on unseen data: {0:.2f}.".format(____))