Datenqualität validieren
Daten sind nicht immer sauber. Sowohl das Feld composer in der Tabelle track als auch name in der Tabelle artist enthalten Informationen über die Autorin bzw. den Autor eines Songs. Du möchtest die Datenqualität in diesen Feldern für jeden Track prüfen. Dafür verwendest du ein CASE-Statement und Spalten aus per JOIN verbundenen Tabellen. Los geht’s!
Diese Übung ist Teil des Kurses
Datenmanipulation in Snowflake
Anleitung zur Übung
- Wenn das Feld
track.composerNULList, dann beschrifte mit'Track Lacks Detail'. - Wenn das Feld
track.composermitartist.nameübereinstimmt, gib'Matching Artist'zurück. - Führe abschließend einen
LEFT JOINder Tabelleartistmitalbumüber das Feldartist_idaus; beachte, dasstrackundalbumbereits für dich verbunden wurden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
SELECT
track.name,
track.composer,
artist.name,
CASE
-- A 'Track Lacks Detail' if the composer field is NULL
WHEN track.composer ___ ___ THEN 'Track Lacks Detail'
-- Use the composer and artist name to determine if a match exists
___ track.composer = ___.name ___ '___'
ELSE 'Inconsistent Data'
END AS data_quality
FROM store.track AS track
LEFT JOIN store.album AS album ON track.album_id = album.album_id
-- Join the album table to artist using the artist_id field
___ JOIN store.___ AS artist ON album.___ = ___.___;