Drzewa decyzyjne jako bazowe modele uczące

Czas zbudować model XGBoost do przewidywania cen domów – nie w Bostonie w stanie Massachusetts, jak w filmie, ale w Ames w stanie Iowa! Zbiór danych z cenami nieruchomości został wczytany do ramki danych df. Jeśli przejrzysz go w Shell, zobaczysz różnorodne cechy opisujące domy i ich lokalizację w mieście.

Celem tego ćwiczenia jest użycie drzew jako bazowych modeli uczących. Domyślnie XGBoost właśnie z nich korzysta, więc nie musisz jawnie podawać booster="gbtree".

xgboost został zaimportowany jako xgb, a tablice cech i wartości docelowych są dostępne odpowiednio w X i y.

Podziel df na zbiór treningowy i testowy, przeznaczając 20% danych na testowanie. Użyj random_state równego 123.
Zainicjalizuj XGBRegressor jako xg_reg, używając seed równego 123. Ustaw funkcję celu na "reg:squarederror" i użyj 10 drzew. Uwaga: nie musisz podawać booster="gbtree", ponieważ jest to wartość domyślna.
Dopasuj xg_reg do danych treningowych i przewidź etykiety zbioru testowego. Zapisz przewidywania w zmiennej preds.
Oblicz rmse, używając np.sqrt() oraz funkcji mean_squared_error() z biblioteki sklearn.metrics, która została już wcześniej zaimportowana.

övning

Drzewa decyzyjne jako bazowe modele uczące

Instruktioner

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}övning

Instruktioner

övning