ComenzarEmpieza gratis

Usar índices de KFold

Ya has creado splits, que contiene índices para el conjunto de datos de candy-data para realizar una validación cruzada de 5 particiones. Para obtener una mejor estimación de cómo rendirá el modelo de random forest de una compañera en datos nuevos, quieres ejecutar este modelo en los cinco conjuntos de índices de entrenamiento y validación que acabas de crear.

En este ejercicio, usarás estos índices para comprobar la exactitud de este modelo con las cinco particiones. Se ha proporcionado un bucle for para ayudarte en este proceso.

Este ejercicio forma parte del curso

Validación de modelos en Python

Ver curso

Instrucciones del ejercicio

  • Usa train_index y val_index para llamar a los índices correctos de X y y al crear los datos de entrenamiento y validación.
  • Ajusta rfc usando el conjunto de entrenamiento.
  • Usa rfc para crear predicciones para el conjunto de validación e imprime la exactitud en validación.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)

# Access the training and validation indices of splits
for train_index, val_index in splits:
    # Setup the training and validation data
    X_train, y_train = X[____], y[____]
    X_val, y_val = X[____], y[____]
    # Fit the random forest model
    rfc.____(____, ____)
    # Make predictions, and print the accuracy
    predictions = rfc.____(____)
    print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))
Editar y ejecutar código