Comece agoraComece grátis

Usando índices do KFold

Você já criou splits, que contém índices para o conjunto de dados candy-data para realizar validação cruzada com 5 folds. Para obter uma estimativa melhor de como o modelo de random forest de um colega vai se sair em novos dados, você quer executar esse modelo nos cinco pares de índices de treino e validação que acabou de criar.

Neste exercício, você vai usar esses índices para verificar a acurácia desse modelo usando as cinco partições. Um loop for foi fornecido para ajudar nesse processo.

Este exercicio faz parte do curso

Validação de Modelos em Python

Ver curso

Instruções do exercicio

  • Use train_index e val_index para acessar os índices corretos de X e y ao criar os dados de treino e validação.
  • Ajuste rfc usando o conjunto de treino
  • Use rfc para criar previsões no conjunto de validação e imprima a acurácia na validação

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)

# Access the training and validation indices of splits
for train_index, val_index in splits:
    # Setup the training and validation data
    X_train, y_train = X[____], y[____]
    X_val, y_val = X[____], y[____]
    # Fit the random forest model
    rfc.____(____, ____)
    # Make predictions, and print the accuracy
    predictions = rfc.____(____)
    print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))
Editar e Executar Código