1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w R

Connected

ćwiczenie

Od zera do bohatera

Opanowałeś już tworzenie specyfikacji modelu i podział danych na zbiory treningowy i testowy. Wiesz też, jak unikać niezrównoważonego rozkładu klas przy podziale. Czas połączyć wszystko, czego się nauczyłeś, i zbudować model korzystający wyłącznie ze zbioru treningowego!

Zbudujesz teraz prawdziwy potok uczenia maszynowego. Składa się on z trzech kroków: tworzenia specyfikacji modelu, podziału danych na zbiory treningowy i testowy, oraz – co równie ważne – dopasowania modelu do danych treningowych. Do dzieła!

Instrukcje

100 XP
  • Utwórz diabetes_split – podział, w którym zbiór treningowy zawiera trzy czwarte wszystkich wierszy ze zbioru diabetes, a rozkład zmiennej outcome jest podobny w obu zbiorach: treningowym i testowym.
  • Zdefiniuj specyfikację drzewa decyzyjnego dla swojego modelu, używając silnika rpart, i zapisz ją jako tree_spec.
  • Dopasuj model model_trained do danych treningowych z diabetes_split, przyjmując outcome jako zmienną docelową, a bmi i skin_thickness jako predyktory.