1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Průzkumná analýza dat v SQL

Connected

cvičení

Vytvoření tabulky s indikátorovými proměnnými

Zjisti, zda žádosti střední a vysoké priority v datech evanston311 s větší pravděpodobností obsahují kontaktní údaje žadatele: e-mailovou adresu nebo telefonní číslo.

  • E-maily obsahují znak @.
  • Telefonní čísla mají formát tří znaků, pomlčky, tří znaků, pomlčky a čtyř znaků. Například: 555-555-1212.

Pro vyhledávání těchto vzorů použij LIKE. Připomeňme, že % odpovídá libovolnému počtu znaků (i nule) a _ odpovídá právě jednomu znaku. Pokud vzor uzavřeš do % (tj. před i za vzorem), umožníš tím vyhledávání daného vzoru v rámci delšího textu.

Například '%___.com%' ti umožní vyhledat odkaz na webovou stránku s doménou nejvyšší úrovně '.com', před níž jsou alespoň tři znaky.

Vytvoř dočasnou tabulku, do které uložíš indikátorové proměnné pro e-mail a telefon. LIKE vrací hodnotu True nebo False, ale přetypování booleanu (True nebo False) na integer převede True na 1 a False na 0. Díky tomu bude hodnoty snazší později sumarizovat.

Pokyny 1/2

undefined XP
    1
    2
  • Vytvoř dočasnou tabulku indicators z dat evanston311 se třemi sloupci: id, email a phone.

  • Pomocí porovnání LIKE detekuj vzory e-mailu a telefonního čísla v sloupci description a výsledek přetypuj na integer pomocí CAST().

    • Indikátor telefonu by měl kombinovat podtržítka _ a pomlčky - tak, aby reprezentoval standardní formát desetimístného telefonního čísla.
    • Nezapomeň vzory začít a ukončit znakem %, aby bylo možné je vyhledat v rámci delšího textu!