1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark z pakietem sparklyr w R

Connected

ćwiczenie

Las losowy: wizualizacja

Teraz czas na wizualizację prognoz. W przypadku modelu drzew gradientowych narysowałeś wykres punktowy prognozowanych odpowiedzi w stosunku do rzeczywistych oraz wykres gęstości reszt. Teraz dostosujesz te wykresy tak, aby jednocześnie wyświetlały wyniki obu modeli.

Instrukcje

100 XP

Lokalna tibble both_responses, zawierająca prognozowane i rzeczywiste lata dla obu modeli, została wcześniej zdefiniowana.

  • Zaktualizuj wykres punktowy prognozowanych vs. rzeczywistych odpowiedzi.
    • Użyj zbioru danych both_responses.
    • Dodaj estetykę koloru, aby każdy model był rysowany innym kolorem. Użyj color = model.
    • Zamiast rysować punkty, użyj geom_smooth(), aby narysować wygładzoną krzywą dla każdego modelu.
  • Utwórz tibble reszt o nazwie residuals.
    • Wywołaj mutate() na both_responses.
    • Nowa kolumna powinna nazywać się residual.
    • Wartość residual powinna być równa prognozowanej odpowiedzi minus rzeczywista odpowiedź.
  • Zaktualizuj wykres gęstości reszt.
    • Dodaj estetykę koloru, aby każdy model był rysowany innym kolorem.