IniziaInizia gratis

Crea un set di holdout

La tua responsabile ti ha chiesto di creare un semplice modello di random forest sul dataset tic_tac_toe. Non vuole che tu perda troppo tempo a selezionare i parametri; vuole piuttosto sapere quanto bene il modello si comporterà su dati futuri. Per le prossime partite di Tris (Tic-Tac-Toe), sarebbe utile sapere se il tuo modello può prevedere quale giocatore vincerà.

Il dataset tic_tac_toe è stato caricato e pronto all'uso.

Nota che in Python, =\ indica che il codice era troppo lungo per stare su una sola riga ed è stato diviso su due righe.

Questo esercizio fa parte del corso

Validazione dei modelli in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea l'insieme di dati X creando variabili fittizie per tutte le colonne categoriche.
  • Suddividi X e y in insiemi di train (X_train, y_train) e test (X_test, y_test).
  • Effettua la suddivisione usando il 10% per il test

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]

# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____  = ____(X, y, ____=____, random_state=1111)
Modifica ed esegui il codice