1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zobecněné lineární modely v Pythonu

Connected

ćwiczenie

Kódování kategorických proměnných

V předchozích cvičeních jsi procvičoval/a vytváření modelových matic pro spojité proměnné a transformaci proměnných. V tomto cvičení si vyzkoušíš různé způsoby kódování kategorické proměnné.

Kategorická data umožňují analyzovat a porovnávat vztahy mezi různými skupinami nebo faktory. Proto je volba referenční skupiny důležitá – a v závislosti na konkrétní studii ji možná budeš chtít změnit oproti výchozímu nastavení. Častým důvodem pro změnu referenční skupiny je to, že interpretace odhadů koeficientů je pak pro danou studii smysluplnější a zajímavější.

V tomto cvičení se vrátíme k datasetu crab, kde color a spine jsou kategorické proměnné.

Dataset crab je v pracovním prostoru přednahrán.

Instrukcje 1/2

undefined XP
    1
    2
  • Importuj dmatrix z knihovny patsy.
  • Pomocí funkce dmatrix() sestav a vypiš modelovou matici s proměnnou color jako kategorickou proměnnou s využitím funkce C().