Probando ideas del foro de Kaggle
Por desgracia, no todas las publicaciones del Foro y los Kernels son necesariamente útiles para tu modelo. Así que, en lugar de incorporar ideas a ciegas en tu pipeline, es mejor que las pruebes primero.
Tienes una función get_cv_score(), que recibe un conjunto de entrenamiento como argumento y devuelve el RMSE de validación global usando validación cruzada de 3 particiones. El DataFrame train ya está disponible en tu espacio de trabajo.
Prueba distintas sugerencias del Foro de Kaggle y comprueba si mejoran tu métrica de validación.
Este ejercicio forma parte del curso
Cómo ganar una competición de Kaggle con Python
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
# Drop passenger_count column
new_train_1 = train.____('____', axis=1)
# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)
print('Initial score is {} and the new score is {}'.format(initial_score, new_score))