1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in SQL Server Databases

Connected

cvičení

Sjednocování řetězců

Při práci s daty se často setkáš s nekonzistentními řetězci – různé zápisy pro jednu a tutéž věc. I když mohou být všechny hodnoty technicky platné, je lepší je sjednotit, aby analýza dávala smysl.

Spustíš tento dotaz, který vyfiltruje všechna letiště ve městě 'Chicago':

SELECT * FROM airports 
WHERE airport_code IN ('ORD', 'MDW')

Ve výsledcích zjistíš, že sloupec airport_city obsahuje nekonzistentní hodnoty pro 'Chicago' – například 'ch'. Tyto nekonzistentní hodnoty opravíš pomocí nahrazení.

Instrukce 1/3

undefined XP
  • 1
    • Nahraď 'ch' hodnotou 'Chicago' – všimni si, že 'Chicago' se změnilo na 'Chicagoicago'.
  • 2
    • Pomocí CASE nahraď 'ch' hodnotou 'Chicago' ve všech řádcích, kde hodnota není 'Chicago'.
    • Sloupec airport_city jinak neměň.
  • 3
    • Sjednoť hodnoty 'Chicago' a 'ch' na 'CH' tak, že nahradíš 'Chicago' hodnotou 'ch' a výsledek převedeš na velká písmena.