1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in PostgreSQL Databases

Connected

Cvičení

Agregace filmových kategorií

V posledním cvičení tohoto kurzu se vrátíme k tabulce film_permit. Obsahuje sloupec community_board typu TEXT, jehož hodnoty jsou čárkou oddělené seznamy celých čísel. Cílem je provést analýzu typů filmových povolení vydaných pro jednotlivé komunitní rady. Jenže způsob, jakým jsou komunitní rady reprezentovány (čísla typu INTEGER uložená ve sloupci TEXT), to komplikuje. S pomocí technik z této kapitoly data transformujeme tak, aby taková analýza byla možná.

V tomto cvičení nejprve vytvoříš (dočasný) VIEW, který zobrazuje hodnoty community_board jednotlivě pro dvě kategorie povolení. VIEW je pojmenovaný dotaz, který lze po vytvoření používat stejně jako TABLE. Tento VIEW pak využiješ v poddotazu pro agregaci výsledků do kontingenční tabulky.

Pokyny 1/2

undefined XP
    1
    2
  • Pomocí funkce REGEXP_SPLIT_TO_TABLE() rozděl sloupec community_board do více řádků s použitím čárky (',') následované mezerou (' ') jako 2znakového oddělovače.
  • Omez hodnoty sloupce category na 'Film', 'Television' a 'Documentary'.