1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in R

Connected

cvičení

Natrénuj model

Specifikace modelu je dobrý začátek – jako prázdné plátno pro malíře. Jenže stejně jako malíř potřebuje barvy, i specifikace potřebuje data. Teprve hotový model dokáže dělat předpovědi:

Specifikace modelu + data = model

V tomto cvičení natrénuješ rozhodovací strom, který modeluje riziko diabetu na základě zdravotních proměnných jako prediktorů. Cílová proměnná outcome říká, zda pacient diabetes má nebo nemá – jde tedy o binární klasifikační úlohu (existují jen dvě třídy). Dataset dále obsahuje zdravotní proměnné pacientů, například blood_pressure, age a bmi.

Po zbytek kurzu bude balíček tidymodels vždy předem načtený. V tomto cvičení máš v pracovním prostředí k dispozici také dataset diabetes.

Pokyny

100 XP
  • Vytvoř tree_spec, specifikaci rozhodovacího stromu s enginem rpart.
  • Natrénuj model tree_model_bmi, ve kterém outcome závisí pouze na prediktoru bmi, a to nafitováním datasetu diabetes na danou specifikaci.
  • Vypiš model do konzole.