1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování statistických otázek k pohovoru v R

Connected

Cvičení

Trénování logistických modelů

Mnoho obchodních problémů vyžaduje předpověď binární výstupní proměnné. Tvůj budoucí zaměstnavatel může potřebovat detekovat spamové e-maily, podvody s kreditními kartami nebo vzácná onemocnění.

Logistická regrese je standardní metoda pro problémy binární klasifikace.

V tomto cvičení použiješ dataset Parkinson's z repozitáře UCI. Tento dataset obsahuje řadu biomedicínských hlasových měření od lidí s Parkinsonovou nemocí i bez ní.

Z datasetu budeš pracovat s těmito proměnnými:

  • status – 1, pokud osoba trpí Parkinsonovou nemocí, 0 v opačném případě,
  • NHR – míra poměru šumu k tonálním složkám hlasu,
  • DFA – fraktální škálovací exponent signálu.

Dataset je dostupný jako parkinsons.

Pokyny 1/2

undefined XP
    1
    2
  • Vykresli bodový graf proměnné status v závislosti na NHR z datasetu parkinsons.
  • Vykresli bodový graf proměnné status v závislosti na DFA z datasetu parkinsons.