Testare le idee dal forum di Kaggle
Purtroppo, non tutti i post del Forum e i Kernel sono necessariamente utili per il tuo modello. Quindi, invece di incorporare le idee alla cieca nella tua pipeline, dovresti prima metterle alla prova.
Hai a disposizione la funzione get_cv_score(), che accetta un insieme di dati di training come argomento e restituisce la root mean squared error di validazione complessiva su una cross-validation a 3 fold. Il DataFrame train è già disponibile nel tuo workspace.
Prova diversi suggerimenti dal Forum di Kaggle e verifica se migliorano il tuo punteggio di validazione.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
# Drop passenger_count column
new_train_1 = train.____('____', axis=1)
# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)
print('Initial score is {} and the new score is {}'.format(initial_score, new_score))