1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Boosting pro predikci příjmů

Počáteční model dosáhl RMSE přibližně 7.34. Pojďme se podívat, jestli to dokážeme zlepšit pomocí jedné iterace boostingu.

Postavíš další lineární regresi, tentokrát ale jako cílové hodnoty použiješ chyby základního modelu, vypočítané takto:

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

Pro tento model použiješ místo příznaku 'budget' příznak 'popularity' — doufáme, že odhalí informativnější vzory. Máš ho k dispozici jako X_train_pop a X_test_pop. Stejně jako v předchozím cvičení jsou vstupní příznaky již standardizované.

Pokyny

100 XP
  • Natrénuj lineární regresní model na předchozích chybách s využitím X_train_pop a y_train_error.
  • Vypočítej predikované chyby na testovací sadě X_test_pop.
  • Vypočítej RMSE stejně jako v předchozím cvičení, tentokrát pomocí y_test_error a pred_error.