1. 학습
  2. /
  3. 강의
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

연습 문제

Rozhodovací stromy jako základní modely

Teď přišel čas sestavit model XGBoost pro predikci cen nemovitostí – tentokrát ne v Bostonu, ale v Ames v Iowě! Dataset s cenami nemovitostí je předem načtený do DataFrame s názvem df. Pokud ho prozkoumáš v shellu, uvidíš, že obsahuje různé vlastnosti domu i jeho polohy ve městě.

Cílem tohoto cvičení je použít stromy jako základní modely. XGBoost používá stromy jako základní modely ve výchozím nastavení, takže nemusíš explicitně zadávat booster="gbtree".

xgboost byl naimportován jako xgb a pole příznaků a cílové hodnoty jsou dostupné v proměnných X a y.

지침

100 XP
  • Rozděl df na trénovací a testovací sady s 20 % dat vyhrazených pro testování. Použij random_state s hodnotou 123.
  • Vytvoř instanci XGBRegressor jako xg_reg se seed nastaveným na 123. Zadej cílovou funkci "reg:squarederror" a použij 10 stromů. Poznámka: booster="gbtree" nemusíš zadávat, protože je to výchozí nastavení.
  • Natrénuj xg_reg na trénovacích datech a predikuj štítky testovací sady. Výsledky predikce ulož do proměnné preds.
  • Vypočítej rmse pomocí np.sqrt() a funkce mean_squared_error() z sklearn.metrics, která je předem naimportována.