1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in PostgreSQL Databases

Connected

Cvičení

Řešení neúplných duplicit

Dataset parking_violation byl upraven tak, aby obsahoval sloupec fee s výší pokuty za přestupek. Tento sloupec by se hodil pro sledování příjmů z parkovacích pokut v New Yorku. Jenže kvůli duplicitním záznamům o přestupcích by výpočty příjmů z tohoto datasetu nebyly přesné. Tyto duplicitní záznamy se liší pouze hodnotou ve sloupci fee – ostatní hodnoty mají shodné. Bylo rozhodnuto, že k vyřešení nejednoznačnosti způsobené duplicitami se použije nejnižší hodnota fee.

Identifikuj 3 duplicitní záznamy v parking_violation a pomocí funkce MIN() zjisti, jaká hodnota fee bude použita po odstranění duplicit.

Pokyny

100 XP
  • Vrať summons_number a minimální hodnotu fee pro duplicitní záznamy.
  • Výsledky seskup podle summons_number.
  • Omez výsledky na záznamy, jejichž počet výskytů summons_number je větší než 1.