Waarden groeperen en hercoderen
Er zijn bijna 150 unieke waarden in evanston311.category. Maar sommige categorieën lijken op elkaar en hebben de vorm "Hoofdcategorie - Details". We krijgen een beter beeld van welke verzoeken vaak voorkomen als we aggregeren op de hoofdcategorie.
Maak hiervoor een tijdelijke tabel recode die unieke category-waarden koppelt aan nieuwe, standardized-waarden. Laat de standardized-waarden het deel van de categorie zijn vóór een streepje ('-'). Haal deze waarde op met de functie split_part():
split_part(string text, delimiter text, field int)
Je moet ook nog een paar gevallen extra opschonen die niet in dit patroon passen.
Daarna kun je de tabel evanston311 joinen met recode om verzoeken te groeperen op de nieuwe, gestandaardiseerde (standardized) categoriewaarden.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in SQL
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;
-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
SELECT DISTINCT category,
___(___(___, ___, ___)) AS standardized
-- What table are you selecting the above values from?
FROM ___;
-- Look at a few values before the next step
SELECT DISTINCT standardized
FROM recode
WHERE standardized LIKE 'Trash%Cart'
OR standardized LIKE 'Snow%Removal%';