Unparteiische Duplikate auflösen

Der Datensatz parking_violation wurde um eine Spalte fee ergänzt, die die Gebühr für den Verstoß angibt. Diese Spalte ist hilfreich, um die Einnahmen aus New Yorker Parkknöllchen nachzuverfolgen. Aufgrund doppelter Verstoßdatensätze wären darauf basierende Umsatzberechnungen jedoch nicht korrekt. Diese doppelten Einträge unterscheiden sich nur im Wert der Spalte fee. Alle anderen Spaltenwerte sind in den Duplikaten identisch. Es wurde entschieden, zur Auflösung der durch diese Duplikate entstandenen Uneindeutigkeit die minimale fee zu verwenden.

Identifiziere die 3 doppelten parking_violation-Datensätze und verwende die Funktion MIN(), um die fee zu bestimmen, die nach dem Entfernen der Duplikate verwendet wird.

Diese Übung ist Teil des Kurses

<Kurs>Datenbereinigung in PostgreSQL-Datenbanken</Kurs>

Kurs ansehen

Übungsanweisungen

Gib die summons_number und die minimale fee für doppelte Einträge zurück.
Gruppiere die Ergebnisse nach summons_number.
Beschränke die Ergebnisse auf Einträge, deren Anzahl der summons_number größer als 1 ist.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

SELECT 
	-- Include SELECT list columns
	___, 
    ___(___) AS fee
FROM 
	parking_violation 
GROUP BY
	-- Define column for GROUP BY
	___ 
HAVING 
	-- Restrict to summons numbers with count greater than 1
	___(___) ___ ___;

Code bearbeiten und ausführen