ComenzarEmpieza gratis

Probando ideas del foro de Kaggle

Por desgracia, no todas las publicaciones del Foro y los Kernels son necesariamente útiles para tu modelo. Así que, en lugar de incorporar ideas a ciegas en tu pipeline, es mejor que las pruebes primero.

Tienes una función get_cv_score(), que recibe un conjunto de entrenamiento como argumento y devuelve el RMSE de validación global usando validación cruzada de 3 particiones. El DataFrame train ya está disponible en tu espacio de trabajo.

Prueba distintas sugerencias del Foro de Kaggle y comprueba si mejoran tu métrica de validación.

Este ejercicio forma parte del curso

Cómo ganar una competición de Kaggle con Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Drop passenger_count column
new_train_1 = train.____('____', axis=1)

# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)

print('Initial score is {} and the new score is {}'.format(initial_score, new_score))
Editar y ejecutar código