Ideeën uit het Kaggle-forum testen
Helaas zijn niet alle forumberichten en Kernels per se nuttig voor je model. In plaats van ideeën klakkeloos in je pipeline te stoppen, moet je ze eerst testen.
Je krijgt een functie get_cv_score(), die een train-gegvensset als argument neemt en de algehele validatie-root mean squared error over 3-fold cross-validation teruggeeft. De train DataFrame is al beschikbaar in je werkomgeving.
Probeer verschillende suggesties van het Kaggle-forum en kijk of ze je validatiescore verbeteren.
Deze oefening maakt deel uit van de cursus
Een Kaggle-competitie winnen met Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Drop passenger_count column
new_train_1 = train.____('____', axis=1)
# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)
print('Initial score is {} and the new score is {}'.format(initial_score, new_score))