1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in SQL Server Databases

Connected

cvičení

Porovnávání jmen pomocí DIFFERENCE()

V předchozím cvičení jsi použil/a SOUNDEX() ke kontrole jmen statistiků z tabulky flight_statistics.

Tentokrát chceš udělat něco podobného, ale s využitím funkce DIFFERENCE(). Funkce DIFFERENCE() vrátí hodnotu 4, pokud jsou dva řetězce podobné nebo totožné, a hodnotu 0, pokud si jsou velmi málo podobné nebo nepodobné vůbec.

Pokud DIFFERENCE() vrátí pro dva řetězce hodnotu 4, ale porovnávané texty jsou různé, najdeš tím data, která je potřeba vyčistit.

Pokyny

100 XP
  • Vyber jedinečné hodnoty sloupců statistician_name a statistician_surname z S1.
  • Proveď inner join tabulky flight_statistics jako S2 na základě podobně znějících křestních jmen a příjmení — konkrétně u záznamů, kde je hodnota DIFFERENCE mezi příslušnými sloupci obou tabulek rovna 4.
  • Vyfiltruj záznamy, kde se sloupce statistician_name a statistician_surname v S1 a S2 navzájem liší.