MulaiMulai sekarang secara gratis

Kelompokkan dan ubah kode nilai

Ada hampir 150 nilai berbeda pada evanston311.category. Namun, sebagian kategori mirip, dengan format "Kategori Utama - Rincian". Kita dapat memahami permintaan yang umum dengan lebih baik jika kita mengagregasi berdasarkan kategori utama.

Untuk itu, buat tabel sementara recode yang memetakan nilai category yang berbeda ke nilai baru, standardized. Jadikan nilai standardized sebagai bagian kategori sebelum tanda pisah ('-'). Ekstrak nilai ini dengan fungsi split_part():

split_part(string text, delimiter text, field int)

Anda juga perlu melakukan pembersihan tambahan untuk beberapa kasus yang tidak sesuai dengan pola ini.

Kemudian tabel evanston311 dapat di-join dengan recode untuk mengelompokkan permintaan berdasarkan nilai kategori standardized yang baru.

Latihan ini adalah bagian dari kursus

Analisis Data Eksploratif di SQL

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;

-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
  SELECT DISTINCT category, 
         ___(___(___, ___, ___)) AS standardized
    -- What table are you selecting the above values from?
    FROM ___;
    
-- Look at a few values before the next step
SELECT DISTINCT standardized 
  FROM recode
 WHERE standardized LIKE 'Trash%Cart'
    OR standardized LIKE 'Snow%Removal%';
Edit dan Jalankan Kode