1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark z pakietem sparklyr w R

Connected

ćwiczenie

Las losowy: predykcja

Teraz czas na wykonanie predykcji za pomocą modelu lasu losowego. Składnia jest taka sama jak w przypadku modelu gradientowego wzmacniania drzew.

Instrukcje

100 XP

Połączenie ze Sparkiem zostało utworzone jako spark_conn. Tibble powiązane ze zbiorami treningowym i testowym zapisanymi w Sparku są wstępnie zdefiniowane jako track_data_to_model_tbl i track_data_to_predict_tbl. Model lasu losowego jest wstępnie zdefiniowany jako random_forest_model.

  • Zdefiniuj zmienną predicted, która będzie zawierać predykcje modelu dla danych testowych.
    • Wywołaj ml_predict(), przekazując model oraz dane testowe jako argumenty. Funkcja ta wygeneruje predykcje dla zbioru testowego i doda je jako nową kolumnę o nazwie prediction.
  • Zdefiniuj zmienną responses, aby przygotować dane do porównania przewidywanych wyników z rzeczywistymi:
    • Wybierz kolumnę z odpowiedzią year.
    • Zbierz wyniki.
    • Użyj mutate(), aby dodać predykcje z obiektu predicted.