Aşırı basitleştiriyor muyum (underfitting)?
Gelecekteki bir Tic-Tac-Toe oyununu kazanıp kazanmayacağını tahmin etmek için bir random forest modeli oluşturuyorsun. tic_tac_toe veri kümesini kullanarak X_train, X_test, y_train ve y_test olmak üzere eğitim ve test veri kümelerini oluşturdun.
Ağaç sayısı farklı olan bir sürü random forest modeli kurmaya karar verdin (1, 2, 3, 4, 5, 10, 20 ve 50). Daha fazla ağaç kullandıkça modelinin çalışması daha uzun sürecek. Ancak yeterince ağaç kullanmazsan underfitting riski var. Farklı ağaç sayılarında modelini denemek için bir for döngüsü oluşturdun.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- Her döngüde, hem
X_trainhem deX_testveri kümeleri için tahmin yap. - Her döngüde,
y_trainveri kümesinin ve karşılık gelen tahminlerinaccuracy_score()değerinitrain_scoreslistesine ekle. - Her döngüde,
y_testveri kümesinin ve karşılık gelen tahminlerinaccuracy_score()değerinitest_scoreslistesine ekle. - Yazdırma ifadelerini kullanarak eğitim ve test skorlarını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.metrics import accuracy_score
test_scores, train_scores = [], []
for i in [1, 2, 3, 4, 5, 10, 20, 50]:
rfc = RandomForestClassifier(n_estimators=i, random_state=1111)
rfc.fit(X_train, y_train)
# Create predictions for the X_train and X_test datasets.
train_predictions = rfc.predict(____)
test_predictions = rfc.predict(____)
# Append the accuracy score for the test and train predictions.
train_scores.append(round(____(____, ____), 2))
test_scores.append(round(____(____, ____), 2))
# Print the train and test scores.
print("The training scores were: {}".format(____))
print("The testing scores were: {}".format(____))