Predições de classificação
Na validação de modelos, muitas vezes é importante saber mais sobre as predições do que apenas a classificação final. Ao prever quem vai vencer um jogo, a maioria das pessoas também quer saber qual é a probabilidade de um time ganhar.
| Probability | Prediction | Meaning |
|---|---|---|
| 0 < .50 | 0 | Team Loses |
| .50 + | 1 | Team Wins |
Neste exercício, você vai explorar os métodos .predict() e .predict_proba() usando o conjunto de dados tic_tac_toe. O primeiro método retorna uma predição sobre se o Jogador Um vai vencer o jogo, e o segundo método fornece a probabilidade de o Jogador Um vencer. Use rfc como o modelo de classificação random forest.
Este exercício faz parte do curso
Validação de Modelos em Python
Instruções do exercício
- Crie dois arrays de predições: um para os valores de classificação e outro para as probabilidades previstas.
- Use o método
.value_counts()de uma Series do pandas para imprimir o número de observações atribuídas a cada classe. - Imprima a primeira observação de
probability_predictionspara ver como as probabilidades são estruturadas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit the rfc model.
rfc.fit(X_train, y_train)
# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)
# Print out count of binary predictions
print(pd.Series(____).____())
# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))