Onvolledige records analyseren
Om het aantal ontbrekende vehicle_body_type-waarden in de toekomst te verminderen, heeft je team besloten een campagne te starten om uitgevende instanties te informeren over het belang van volledige data. Elke campagne wordt echter afgestemd op afzonderlijke instanties.
In deze oefening is je doel de huidige ontbrekende waarden te gebruiken om deze campagnes te prioriteren. Je schrijft een query die de uitgevende instanties weergeeft, samen met het aantal records dat aan die instantie is toe te schrijven met een NULL vehicle_body_type. Deze records worden in aflopende volgorde weergegeven om te bepalen in welke volgorde de voorlichtingscampagnes moeten worden ontwikkeld.
Deze oefening maakt deel uit van de cursus
Data opschonen in PostgreSQL-databases
Oefeninstructies
- Specificeer twee kolommen voor de queryresultaten:
issuing_agencyennum_missing(het aantal ontbrekende voertuigcarrosserietypen voor de uitgevende instantie). - Beperk de resultaten zodat alleen
NULL-waarden voorvehicle_body_typeworden meegeteld. - Groepeer de resultaten per
issuing_agency. - Sorteer de resultaten op
num_missingin aflopende volgorde.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
SELECT
-- Define the SELECT list: issuing_agency and num_missing
___,
COUNT(*) AS ___
FROM
parking_violation
WHERE
-- Restrict the results to NULL vehicle_body_type values
___
-- Group results by issuing_agency
___
-- Order results by num_missing in descending order
___;