1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning v R: Klasifikace

Connected

cvičení

Binární předpověď

V předchozím cvičení jsi pomocí funkce glm() sestavil/a model logistické regrese pro chování dárců. Stejně jako u většiny metod strojového učení v R můžeš na objekt modelu aplikovat funkci predict() a předpovídat budoucí chování. Výchozí výstup funkce predict() jsou predikce v podobě logaritmických šancí (log odds), pokud nezadáš type = "response". Tato volba převede logaritmické šance na pravděpodobnosti.

Protože model logistické regrese odhaduje pravděpodobnost výsledku, je na tobě, abys určil/a práh, při kterém pravděpodobnost naznačuje konkrétní akci. Je nutné najít rovnováhu mezi přílišnou opatrností a přílišnou agresivitou. Kdybys například oslovil/a jen lidi s pravděpodobností daru 99 % a více, mohl/a bys přijít o mnoho lidí s nižší odhadovanou pravděpodobností, kteří by přesto darovali. Tato rovnováha je zvláště důležitá u silně nevyvážených výsledků – jako v tomto datasetu, kde jsou dary relativně vzácné.

Dataset donors a model donation_model máš k dispozici.

Pokyny

100 XP
  • Pomocí funkce predict() odhadni pravděpodobnost daru pro každou osobu. Použij argument type pro získání pravděpodobností. Výsledné predikce ulož do nového sloupce donation_prob.
  • Zjisti skutečnou pravděpodobnost, že průměrná osoba přispěje, předáním příslušného sloupce datového rámce donors funkci mean().
  • Pomocí ifelse() předpověz dar v případě, že odhadovaná pravděpodobnost daru je vyšší než průměr. Výsledné predikce ulož do nového sloupce donation_pred.
  • Pomocí funkce mean() vypočítej přesnost modelu.