1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w bazach PostgreSQL

Connected

ćwiczenie

Rozwiązywanie niejednoznacznych duplikatów

Zbiór danych parking_violation został zmodyfikowany o kolumnę fee, która wskazuje wysokość opłaty za dane naruszenie. Kolumna ta przydaje się do śledzenia przychodów z mandatów parkingowych w Nowym Jorku. Jednak z powodu zduplikowanych rekordów naruszenia obliczenia przychodów na podstawie tego zbioru danych byłyby niedokładne. Duplikaty różnią się wyłącznie wartością w kolumnie fee – wszystkie pozostałe wartości kolumn są identyczne. Zdecydowano, że do rozwiązania niejednoznaczności wynikającej z duplikatów zostanie użyta minimalna wartość fee.

Zidentyfikuj 3 zduplikowane rekordy w tabeli parking_violation i użyj funkcji MIN(), aby ustalić wartość fee, która zostanie zastosowana po usunięciu duplikatów.

Instrukcje

100 XP
  • Zwróć kolumnę summons_number oraz minimalną wartość fee dla zduplikowanych rekordów.
  • Pogrupuj wyniki według kolumny summons_number.
  • Ogranicz wyniki do rekordów, których liczba wystąpień summons_number jest większa niż 1.