Mulai sekarangMulai gratis

Apakah saya underfitting?

Anda membuat model random forest untuk memprediksi apakah Anda akan menang dalam permainan Tic-Tac-Toe di masa depan. Dengan menggunakan himpunan data tic_tac_toe, Anda telah membuat himpunan data pelatihan dan pengujian, yaitu X_train, X_test, y_train, dan y_test.

Anda memutuskan untuk membuat sejumlah model random forest dengan jumlah pohon yang bervariasi (1, 2, 3, 4, 5, 10, 20, dan 50). Semakin banyak pohon yang Anda gunakan, semakin lama waktu eksekusi model random forest Anda. Namun, jika jumlah pohon tidak cukup, Anda berisiko mengalami underfitting. Anda telah membuat sebuah perulangan for untuk menguji model pada berbagai jumlah pohon tersebut.

Latihan ini merupakan bagian dari kursus

Validasi Model di Python

Lihat Kursus

Instruksi latihan

  • Pada setiap iterasi, prediksikan nilai untuk himpunan data X_train dan X_test.
  • Pada setiap iterasi, tambahkan accuracy_score() dari himpunan data y_train dan prediksi yang sesuai ke train_scores.
  • Pada setiap iterasi, tambahkan accuracy_score() dari himpunan data y_test dan prediksi yang sesuai ke test_scores.
  • Cetak skor pelatihan dan pengujian menggunakan pernyataan print yang disediakan.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

from sklearn.metrics import accuracy_score

test_scores, train_scores = [], []
for i in [1, 2, 3, 4, 5, 10, 20, 50]:
    rfc = RandomForestClassifier(n_estimators=i, random_state=1111)
    rfc.fit(X_train, y_train)
    # Create predictions for the X_train and X_test datasets.
    train_predictions = rfc.predict(____)
    test_predictions = rfc.predict(____)
    # Append the accuracy score for the test and train predictions.
    train_scores.append(round(____(____, ____), 2))
    test_scores.append(round(____(____, ____), 2))
# Print the train and test scores.
print("The training scores were: {}".format(____))
print("The testing scores were: {}".format(____))
Edit dan Jalankan Kode