ComeçarComece de graça

Predições de classificação

Na validação de modelos, muitas vezes é importante saber mais sobre as predições do que apenas a classificação final. Ao prever quem vai vencer um jogo, a maioria das pessoas também quer saber qual é a probabilidade de um time ganhar.

Probability Prediction Meaning
0 < .50 0 Team Loses
.50 + 1 Team Wins

Neste exercício, você vai explorar os métodos .predict() e .predict_proba() usando o conjunto de dados tic_tac_toe. O primeiro método retorna uma predição sobre se o Jogador Um vai vencer o jogo, e o segundo método fornece a probabilidade de o Jogador Um vencer. Use rfc como o modelo de classificação random forest.

Este exercício faz parte do curso

Validação de Modelos em Python

Ver curso

Instruções do exercício

  • Crie dois arrays de predições: um para os valores de classificação e outro para as probabilidades previstas.
  • Use o método .value_counts() de uma Series do pandas para imprimir o número de observações atribuídas a cada classe.
  • Imprima a primeira observação de probability_predictions para ver como as probabilidades são estruturadas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit the rfc model. 
rfc.fit(X_train, y_train)

# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)

# Print out count of binary predictions
print(pd.Series(____).____())

# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))
Editar e executar o código