1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Inference for Categorical Data in R

Connected

cvičení

Extrakce první cifry I

Abys mohl/a prošetřit otázku volebních podvodů, začni vytvořením nového sloupce obsahujícího první cifru celkového počtu odevzdaných hlasů. K tomu budeš potřebovat vlastní funkci get_first(), kterou jsme pro tebe připravili. Jejím základem je funkce substr(), která vezme řetězec a vyextrahuje z něj část — tzv. podřetězec.

Jakmile nový sloupec s první cifrou vytvoříš, můžeš pomocí sloupcového grafu vizuálně posoudit, jak blízko se data drží Benfordova zákona.

Pokyny

100 XP
  • Podívej se, jak funguje get_first() — zadej prostě název funkce (bez závorek). Jediné, co dělá, je upravit výstup z substr() tak, aby byl faktorem.
  • Přidej do datového rámce iran mutací nový sloupec first_digit, který bude obsahovat první cifru celkového počtu hlasů odevzdaných v každém městě.
  • Ověř, že get_first() funguje správně. Z dat iran vyber sloupce total_votes_cast a first_digit a vypiš je na obrazovku.
  • Sestav sloupcový graf pro vizualizaci rozdělení první cifry.