BaşlayınÜcretsiz Başlayın

Görülmüş vs. görülmemiş veri

Modeller, daha önce gördükleri gözlemlerde genellikle daha yüksek doğruluğa sahiptir. Şeker verisinde, Skittles'ın popülerliğini tahmin etmek, Andes Mints'in popülerliğini tahmin etmekten muhtemelen daha doğru olacaktır; çünkü Skittles veri kümesinde var, Andes Mints yok.

X_train veri kümesini kullanarak 50 şeker üzerinden bir model kurdun ve modelin, kurulduğu 50 şekerin popülerliğini ve hiç görmediği 35 şekerin (X_test) popülerliğini ne kadar doğru tahmin ettiğini raporlaman gerekiyor. Doğruluk metriği olarak ortalama mutlak hata mae() kullanacaksın.

Bu egzersiz

Python'da Model Doğrulama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Girdi verisi olarak X_train ve X_testi kullanarak, model.predict() ile tahmin dizileri oluştur.
  • Modelin, daha önce gördüğü ve daha önce görmediği veriler üzerindeki doğruluğunu hesapla.
  • Görülmüş ve görülmemiş veriyi yazdırmak için print ifadelerini kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# The model is fit using X_train and y_train
model.fit(X_train, y_train)

# Create vectors of predictions
train_predictions = model.predict(____)
test_predictions = model.predict(____)

# Train/Test Errors
train_error = mae(y_true=y_train, y_pred=____)
test_error = mae(y_true=y_test, y_pred=____)

# Print the accuracy for seen and unseen data
print("Model error on seen data: {0:.2f}.".format(____))
print("Model error on unseen data: {0:.2f}.".format(____))
Kodu Düzenle ve Çalıştır