Rozhodovací stromy jako základní modely

Teď přišel čas sestavit model XGBoost pro predikci cen nemovitostí – tentokrát ne v Bostonu, ale v Ames v Iowě! Dataset s cenami nemovitostí je předem načtený do DataFrame s názvem df. Pokud ho prozkoumáš v shellu, uvidíš, že obsahuje různé vlastnosti domu i jeho polohy ve městě.

Cílem tohoto cvičení je použít stromy jako základní modely. XGBoost používá stromy jako základní modely ve výchozím nastavení, takže nemusíš explicitně zadávat booster="gbtree".

xgboost byl naimportován jako xgb a pole příznaků a cílové hodnoty jsou dostupné v proměnných X a y.

Rozděl df na trénovací a testovací sady s 20 % dat vyhrazených pro testování. Použij random_state s hodnotou 123.
Vytvoř instanci XGBRegressor jako xg_reg se seed nastaveným na 123. Zadej cílovou funkci "reg:squarederror" a použij 10 stromů. Poznámka: booster="gbtree" nemusíš zadávat, protože je to výchozí nastavení.
Natrénuj xg_reg na trénovacích datech a predikuj štítky testovací sady. Výsledky predikce ulož do proměnné preds.
Vypočítej rmse pomocí np.sqrt() a funkce mean_squared_error() z sklearn.metrics, která je předem naimportována.

연습 문제

Rozhodovací stromy jako základní modely

지침

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제