1. Učit se
  2. /
  3. Kurzy
  4. /
  5. A/B testování v R

Connected

Cvičení

Formát dat a histogramy

A/B testy pracují se dvěma skupinami, přičemž každá obsahuje data od různých účastníků. Proto je ideálním formátem dlouhý (long) formát datasetu. Abys lépe porozuměl/a datům v jednotlivých skupinách, můžeš vytvořit histogramy – ty pak v A/B testech slouží k posouzení, zda se skupiny od sebe výrazně liší.

Společnost shromáždila data o svých zaměstnancích a chce zjistit, zda ti, kteří příležitostně pijí alkohol (Drinker.yes), chybí v práci častěji než ti, kteří nepijí (Drinker.no). Převeď dataset ze širokého (wide) formátu na dlouhý (long), a pak vytvoř histogramy skupin podle konzumace alkoholu a jejich absence v práci.

Dataset absenteeism je již načtený.

Pokyny 1/2

undefined XP
    1
    2
  • Načti balíčky tidyr a ggplot2 pro převod formátu dat a jejich vizualizaci.
  • Převeď dataset absenteeism do dlouhého formátu a ulož ho jako longabsent. Skupiny pití (Drinker.yes a Drinker.no, v tomto pořadí) zaznamenej do sloupce Group a hodnoty do sloupce Absence.