Usando índices do KFold
Você já criou splits, que contém índices para o conjunto de dados candy-data para realizar validação cruzada com 5 folds. Para obter uma estimativa melhor de como o modelo de random forest de um colega vai se sair em novos dados, você quer executar esse modelo nos cinco pares de índices de treino e validação que acabou de criar.
Neste exercício, você vai usar esses índices para verificar a acurácia desse modelo usando as cinco partições. Um loop for foi fornecido para ajudar nesse processo.
Este exercício faz parte do curso
Validação de Modelos em Python
Instruções do exercício
- Use
train_indexeval_indexpara acessar os índices corretos deXeyao criar os dados de treino e validação. - Ajuste
rfcusando o conjunto de treino - Use
rfcpara criar previsões no conjunto de validação e imprima a acurácia na validação
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
# Access the training and validation indices of splits
for train_index, val_index in splits:
# Setup the training and validation data
X_train, y_train = X[____], y[____]
X_val, y_val = X[____], y[____]
# Fit the random forest model
rfc.____(____, ____)
# Make predictions, and print the accuracy
predictions = rfc.____(____)
print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))