Predizioni di classificazione
Nella validazione dei modelli, spesso è importante sapere di più sulle predizioni oltre alla classe finale. Quando si predice chi vincerà una partita, la maggior parte delle persone è anche interessata a sapere con quale probabilità una squadra vincerà.
| Probability | Prediction | Meaning |
|---|---|---|
| 0 < .50 | 0 | Team Loses |
| .50 + | 1 | Team Wins |
In questo esercizio, esaminerai i metodi .predict() e .predict_proba() usando il dataset tic_tac_toe. Il primo metodo fornirà una predizione sul fatto che il Giocatore Uno vincerà la partita, mentre il secondo metodo restituirà la probabilità che il Giocatore Uno vinca. Usa rfc come modello di classificazione random forest.
Questo esercizio fa parte del corso
Validazione dei modelli in Python
Istruzioni dell'esercizio
- Crea due array di predizioni: uno per i valori di classificazione e uno per le probabilità predette.
- Usa il metodo
.value_counts()per una Series di pandas per stampare il numero di osservazioni assegnate a ciascuna classe. - Stampa la prima osservazione di
probability_predictionsper vedere come sono strutturate le probabilità.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit the rfc model.
rfc.fit(X_train, y_train)
# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)
# Print out count of binary predictions
print(pd.Series(____).____())
# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))