1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Predikce příjmů filmů

Pusťme se do predikce příjmů filmů – začneme jednoduchou lineární regresí, která odhadne log-příjem filmů na základě příznaku 'budget'. Jako metriku použijeme RMSE (odmocninu střední kvadratické chyby). V scikit-learn ji spočítáš pomocí funkce mean_squared_error() z modulu sklearn.metrics a výsledek pak odmocníš pomocí numpy.

Dataset movies je už načtený a rozdělený na trénovací a testovací sadu. Chybějící hodnoty byly nahrazeny nulami a vstupní příznak byl standardizován pomocí StandardScaler(). Pokud se chceš dozvědět více o předzpracování dat pro Machine Learning, podívej se na kurzy DataCampu zaměřené na čištění dat a feature engineering.

Pokyny

100 XP
  • Vytvoř instanci výchozího modelu LinearRegression.
  • Vypočítej predikce na testovací sadě.
  • Vypočítej RMSE. Funkce mean_squared_error() přijímá dva argumenty: y_test a predikce.