1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Natrénuj model logistické regrese

Jakmile máš připravené trénovací a testovací sady, můžeš na trénovací sadě natrénovat model logistické regrese pomocí funkce glm(). Funkce glm() je pokročilejší verzí lm() a umožňuje pracovat s různými typy regresních modelů – nejen s klasickou metodou nejmenších čtverců.

Nezapomeň funkci glm() předat argument family = "binomial", kterým určíš, že chceš použít logistickou (nikoli lineární) regresi. Například:

glm(Target ~ ., family = "binomial", dataset)

Nedělej si starosti s případnými varováními jako glm.fit: algorithm did not converge nebo glm.fit: fitted probabilities numerically 0 or 1 occurred. Ta se na menších datasetech objevují běžně a většinou nepředstavují žádný problém. Obvykle znamenají, že tvůj dataset je dokonale separovatelný, což může způsobovat komplikace pro matematiku za modelem – funkce glm() v R si s tím ale téměř vždy poradí bez potíží.

Jakmile máš model glm() natrénovaný na svém datasetu, můžeš pomocí funkce predict() s argumentem type = "response" předpovídat výsledky (např. skála nebo mina) na testovací sadě test:

predict(my_model, test, type = "response")

Pokyny

100 XP
  • Natrénuj model logistické regrese s názvem model, který bude předpovídat proměnnou Class na základě všech ostatních proměnných jako prediktorů. Použij trénovací sadu datasetu Sonar.
  • Na základě tohoto modelu proveď předpovědi na testovací sadě test. Výsledek ulož do proměnné p, stejně jako jsi to dělal/a dříve.