LoslegenKostenlos loslegen

Datenqualität validieren

Daten sind nicht immer sauber. Sowohl das Feld composer in der Tabelle track als auch name in der Tabelle artist enthalten Informationen über die Autorin bzw. den Autor eines Songs. Du möchtest die Datenqualität in diesen Feldern für jeden Track prüfen. Dafür verwendest du ein CASE-Statement und Spalten aus per JOIN verbundenen Tabellen. Los geht’s!

Diese Übung ist Teil des Kurses

Datenmanipulation in Snowflake

Kurs anzeigen

Anleitung zur Übung

  • Wenn das Feld track.composer NULL ist, dann beschrifte mit 'Track Lacks Detail'.
  • Wenn das Feld track.composer mit artist.name übereinstimmt, gib 'Matching Artist' zurück.
  • Führe abschließend einen LEFT JOIN der Tabelle artist mit album über das Feld artist_id aus; beachte, dass track und album bereits für dich verbunden wurden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

SELECT
    track.name,
    track.composer,
    artist.name,
    CASE
    	-- A 'Track Lacks Detail' if the composer field is NULL
        WHEN track.composer ___ ___ THEN 'Track Lacks Detail'
        -- Use the composer and artist name to determine if a match exists
        ___ track.composer = ___.name ___ '___'
        ELSE 'Inconsistent Data'
    END AS data_quality
FROM store.track AS track
LEFT JOIN store.album AS album ON track.album_id = album.album_id
-- Join the album table to artist using the artist_id field
___ JOIN store.___ AS artist ON album.___ = ___.___;
Code bearbeiten und ausführen