ComeçarComece de graça

Random Forest Classifier - parte 1

Agora vamos criar um primeiro random forest classifier para detecção de fraudes. Tomara que você consiga um resultado melhor do que a acurácia de referência que acabou de calcular, que foi cerca de 96%. Este modelo vai servir como modelo de referência (baseline), que você vai tentar melhorar nos próximos exercícios. Comece dividindo os dados em conjuntos de treino e teste e definindo o modelo Random Forest. Os dados disponíveis são as variáveis X (features) e os rótulos y.

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercício

  • Importe o classificador Random Forest de sklearn.
  • Divida suas variáveis X e rótulos y em conjuntos de treino e teste. Separe 30% para o conjunto de teste.
  • Atribua o random forest classifier à variável model e mantenha random_state igual a 5. Precisamos definir um random state aqui para poder comparar resultados entre diferentes modelos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the random forest model from sklearn
from sklearn.ensemble import ____

# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)

# Define the model as the random forest
model = ____(random_state=5)
Editar e executar o código