Aan de slagGa gratis aan de slag

Ideeën uit het Kaggle-forum testen

Helaas zijn niet alle forumberichten en Kernels per se nuttig voor je model. In plaats van ideeën klakkeloos in je pipeline te stoppen, moet je ze eerst testen.

Je krijgt een functie get_cv_score(), die een train-gegvensset als argument neemt en de algehele validatie-root mean squared error over 3-fold cross-validation teruggeeft. De train DataFrame is al beschikbaar in je werkomgeving.

Probeer verschillende suggesties van het Kaggle-forum en kijk of ze je validatiescore verbeteren.

Deze oefening maakt deel uit van de cursus

Een Kaggle-competitie winnen met Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Drop passenger_count column
new_train_1 = train.____('____', axis=1)

# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)

print('Initial score is {} and the new score is {}'.format(initial_score, new_score))
Code bewerken en uitvoeren