Buat satu holdout set
Atasan Anda meminta Anda membuat model random forest sederhana pada himpunan data tic_tac_toe. Ia tidak ingin Anda menghabiskan banyak waktu memilih parameter; ia lebih ingin mengetahui seberapa baik model akan bekerja pada data di masa depan. Untuk permainan Tic-Tac-Toe berikutnya, akan sangat berguna bila model Anda dapat memprediksi pemain mana yang akan menang.
Himpunan data tic_tac_toe telah dimuat untuk Anda gunakan.
Perhatikan bahwa dalam Python, =\ menandakan kode terlalu panjang untuk satu baris dan telah dipisah menjadi dua baris.
Latihan ini adalah bagian dari kursus
Validasi Model di Python
Petunjuk latihan
- Buat himpunan data
Xdengan membuat variabel dummy untuk semua kolom kategorikal. - Bagi
Xdanymenjadi himpunan train (X_train,y_train) dan test (X_test,y_test). - Lakukan pembagian dengan menggunakan 10% untuk pengujian
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]
# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____ = ____(X, y, ____=____, random_state=1111)