1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Regular Expressions in R

Connected

cvičení

Extrakce pomocí pokročilého regulárního výrazu

V tomto cvičení navážeš na předchozí příklady a vytvoříš pokročilejší regulární výraz, který z každého řádku datového rámce screens_per_movie zachytí název filmu, název distributora a počet pláten.

Každý řádek screens_per_movie obsahuje tyto tři části. Pomocí extract je extrahuješ a získáš tři nové sloupce s přesně těmi informacemi, které chceš – v přehledné, tabulkové podobě. Tento krok je klíčový, pokud chceš dát nestrukturovaným datům smysl a převést je do formy, se kterou lze dále pracovat, analyzovat ji a vizualizovat.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Nejdřív si prohlédni první tři řádky screens_per_movie a seznám se se strukturou dat.