MulaiMulai sekarang secara gratis

Buat satu holdout set

Atasan Anda meminta Anda membuat model random forest sederhana pada himpunan data tic_tac_toe. Ia tidak ingin Anda menghabiskan banyak waktu memilih parameter; ia lebih ingin mengetahui seberapa baik model akan bekerja pada data di masa depan. Untuk permainan Tic-Tac-Toe berikutnya, akan sangat berguna bila model Anda dapat memprediksi pemain mana yang akan menang.

Himpunan data tic_tac_toe telah dimuat untuk Anda gunakan.

Perhatikan bahwa dalam Python, =\ menandakan kode terlalu panjang untuk satu baris dan telah dipisah menjadi dua baris.

Latihan ini adalah bagian dari kursus

Validasi Model di Python

Lihat Kursus

Petunjuk latihan

  • Buat himpunan data X dengan membuat variabel dummy untuk semua kolom kategorikal.
  • Bagi X dan y menjadi himpunan train (X_train, y_train) dan test (X_test, y_test).
  • Lakukan pembagian dengan menggunakan 10% untuk pengujian

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]

# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____  = ____(X, y, ____=____, random_state=1111)
Edit dan Jalankan Kode