Spaltenverteilung und Duplikate
Mit der Funktion Column distribution (Spaltenverteilung) können wir unsere Spalten auf die Anzahl der eindeutigen Werte sowie die Anzahl der verschiedenen Kategorien überprüfen. Das gibt uns einen guten Überblick darüber, welche Spalten Duplikate enthalten und welche Spalten möglicherweise die falsche Anzahl von Kategorien haben.
Weitere Informationen zum Umgang mit Duplikaten findest du in diesem MSFT Learn-Artikel.
Unser Manager hat uns gebeten, die Color
-Spalte in unserem Datensatz zu überprüfen, da es dort einen Fehler zu geben scheint, weil jemand einige Daten falsch eingegeben hat. Er ist sich sicher, dass wir nur 10 verschiedene Produktfarben führen (einschließlich der Produkte ohne Farbe). Nutze die Funktionen in Power Query, um den Datensatz zu überprüfen und zu korrigieren.
Falls du Fortschritte verloren hast, beginne damit, die Arbeitsmappe 2_1_column_distribution.pbix
aus dem Exercises-Ordner auf dem Desktop zu laden und öffne den Power Query Editor.
Diese Übung ist Teil des Kurses
Datenvorbereitung in Power BI
Interaktive Übung
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um
