1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Regular Expressions in R

Connected

cvičení

Použití vzoru „nebo" na větším datasetu

Teď, kdy už rozumíš principu spojování více možností z vektoru, půjdeme o krok dál a aplikujeme to na větší dataset. V globálním prostředí máš k dispozici dvě proměnné: articles a politicians. První obsahuje sbírku zpravodajských článků o švýcarské politice, druhá je seznam jmen švýcarských politiků, kteří se v článcích vyskytují.

Tvým úkolem je zjistit, která jména se objevují v jednotlivých článcích a kolikrát se každý politik vyskytuje v celé sbírce článků.

Pokyny

100 XP
  • Pomocí vektoru politicians vytvoř regulární výraz, který odpovídá všem jménům uloženým v tomto vektoru.
  • Přidej do datového rámce articles nový sloupec, který bude obsahovat všechna jména politiků vyskytující se ve sloupci text.
  • Spoj všechny články dohromady, aby bylo snazší spočítat počet výskytů pro každého politika.
  • Předej vektor politicians jako vzor do funkce str_count().