BaşlayınÜcretsiz Başlayın

Aşırı basitleştiriyor muyum (underfitting)?

Gelecekteki bir Tic-Tac-Toe oyununu kazanıp kazanmayacağını tahmin etmek için bir random forest modeli oluşturuyorsun. tic_tac_toe veri kümesini kullanarak X_train, X_test, y_train ve y_test olmak üzere eğitim ve test veri kümelerini oluşturdun.

Ağaç sayısı farklı olan bir sürü random forest modeli kurmaya karar verdin (1, 2, 3, 4, 5, 10, 20 ve 50). Daha fazla ağaç kullandıkça modelinin çalışması daha uzun sürecek. Ancak yeterince ağaç kullanmazsan underfitting riski var. Farklı ağaç sayılarında modelini denemek için bir for döngüsü oluşturdun.

Bu egzersiz

Python'da Model Doğrulama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Her döngüde, hem X_train hem de X_test veri kümeleri için tahmin yap.
  • Her döngüde, y_train veri kümesinin ve karşılık gelen tahminlerin accuracy_score() değerini train_scores listesine ekle.
  • Her döngüde, y_test veri kümesinin ve karşılık gelen tahminlerin accuracy_score() değerini test_scores listesine ekle.
  • Yazdırma ifadelerini kullanarak eğitim ve test skorlarını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from sklearn.metrics import accuracy_score

test_scores, train_scores = [], []
for i in [1, 2, 3, 4, 5, 10, 20, 50]:
    rfc = RandomForestClassifier(n_estimators=i, random_state=1111)
    rfc.fit(X_train, y_train)
    # Create predictions for the X_train and X_test datasets.
    train_predictions = rfc.predict(____)
    test_predictions = rfc.predict(____)
    # Append the accuracy score for the test and train predictions.
    train_scores.append(round(____(____, ____), 2))
    test_scores.append(round(____(____, ____), 2))
# Print the train and test scores.
print("The training scores were: {}".format(____))
print("The testing scores were: {}".format(____))
Kodu Düzenle ve Çalıştır