Usar índices de KFold
Ya has creado splits, que contiene índices para el conjunto de datos de candy-data para realizar una validación cruzada de 5 particiones. Para obtener una mejor estimación de cómo rendirá el modelo de random forest de una compañera en datos nuevos, quieres ejecutar este modelo en los cinco conjuntos de índices de entrenamiento y validación que acabas de crear.
En este ejercicio, usarás estos índices para comprobar la exactitud de este modelo con las cinco particiones. Se ha proporcionado un bucle for para ayudarte en este proceso.
Este ejercicio forma parte del curso
Validación de modelos en Python
Instrucciones del ejercicio
- Usa
train_indexyval_indexpara llamar a los índices correctos deXyyal crear los datos de entrenamiento y validación. - Ajusta
rfcusando el conjunto de entrenamiento. - Usa
rfcpara crear predicciones para el conjunto de validación e imprime la exactitud en validación.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
# Access the training and validation indices of splits
for train_index, val_index in splits:
# Setup the training and validation data
X_train, y_train = X[____], y[____]
X_val, y_val = X[____], y[____]
# Fit the random forest model
rfc.____(____, ____)
# Make predictions, and print the accuracy
predictions = rfc.____(____)
print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))