ComeçarComece de graça

Usando índices do KFold

Você já criou splits, que contém índices para o conjunto de dados candy-data para realizar validação cruzada com 5 folds. Para obter uma estimativa melhor de como o modelo de random forest de um colega vai se sair em novos dados, você quer executar esse modelo nos cinco pares de índices de treino e validação que acabou de criar.

Neste exercício, você vai usar esses índices para verificar a acurácia desse modelo usando as cinco partições. Um loop for foi fornecido para ajudar nesse processo.

Este exercício faz parte do curso

Validação de Modelos em Python

Ver curso

Instruções do exercício

  • Use train_index e val_index para acessar os índices corretos de X e y ao criar os dados de treino e validação.
  • Ajuste rfc usando o conjunto de treino
  • Use rfc para criar previsões no conjunto de validação e imprima a acurácia na validação

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)

# Access the training and validation indices of splits
for train_index, val_index in splits:
    # Setup the training and validation data
    X_train, y_train = X[____], y[____]
    X_val, y_val = X[____], y[____]
    # Fit the random forest model
    rfc.____(____, ____)
    # Make predictions, and print the accuracy
    predictions = rfc.____(____)
    print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))
Editar e executar o código