Random Forest Classifier - parte 1
Agora vamos criar um primeiro random forest classifier para detecção de fraudes. Tomara que você consiga um resultado melhor do que a acurácia de referência que acabou de calcular, que foi cerca de 96%. Este modelo vai servir como modelo de referência (baseline), que você vai tentar melhorar nos próximos exercícios. Comece dividindo os dados em conjuntos de treino e teste e definindo o modelo Random Forest. Os dados disponíveis são as variáveis X (features) e os rótulos y.
Este exercício faz parte do curso
Detecção de Fraudes em Python
Instruções do exercício
- Importe o classificador Random Forest de
sklearn. - Divida suas variáveis
Xe rótulosyem conjuntos de treino e teste. Separe 30% para o conjunto de teste. - Atribua o random forest classifier à variável
modele mantenharandom_stateigual a 5. Precisamos definir um random state aqui para poder comparar resultados entre diferentes modelos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the random forest model from sklearn
from sklearn.ensemble import ____
# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)
# Define the model as the random forest
model = ____(random_state=5)