1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Natrénuj model náhodného lesa

Jak jsi viděl/a ve videu, modely náhodného lesa jsou mnohem flexibilnější než lineární modely – dokážou zachytit složité nelineární závislosti a automaticky odhalit interakce mezi proměnnými. Na reálných datech zpravidla dosahují velmi dobrých výsledků, takže je vyzkoušíme na datasetu s kvalitou vína. Cílem je předpovědět kvalitu vína hodnocenou lidmi na základě chemických a fyzikálních vlastností každé šarže změřených strojově.

Trénování modelu náhodného lesa probíhá úplně stejně jako trénování zobecněného lineárního regresního modelu z předchozí kapitoly. Stačí změnit argument method ve funkci train na "ranger". Balíček ranger je přepracovanou verzí klasického R balíčku randomForest – trénuje modely výrazně rychleji a přitom dává téměř totožné výsledky. Pro začátečníky doporučujeme právě balíček ranger.

Pokyny

100 XP
  • Natrénuj model náhodného lesa s názvem model na datasetu s kvalitou vína wine tak, aby quality byla cílová proměnná a všechny ostatní proměnné byly vysvětlující.
  • Použij method = "ranger".
  • Nastav tuneLength na 1.
  • Použij 5 CV záhybů.
  • Vypiš model do konzole.