Crea un set di holdout
La tua responsabile ti ha chiesto di creare un semplice modello di random forest sul dataset tic_tac_toe. Non vuole che tu perda troppo tempo a selezionare i parametri; vuole piuttosto sapere quanto bene il modello si comporterà su dati futuri. Per le prossime partite di Tris (Tic-Tac-Toe), sarebbe utile sapere se il tuo modello può prevedere quale giocatore vincerà.
Il dataset tic_tac_toe è stato caricato e pronto all'uso.
Nota che in Python, =\ indica che il codice era troppo lungo per stare su una sola riga ed è stato diviso su due righe.
Questo esercizio fa parte del corso
Validazione dei modelli in Python
Istruzioni dell'esercizio
- Crea l'insieme di dati
Xcreando variabili fittizie per tutte le colonne categoriche. - Suddividi
Xeyin insiemi di train (X_train,y_train) e test (X_test,y_test). - Effettua la suddivisione usando il 10% per il test
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]
# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____ = ____(X, y, ____=____, random_state=1111)