SQL secara ringkas (2)
Tugas umum lainnya di basis data adalah agregasi, yaitu mereduksi himpunan data dengan membaginya menjadi kelompok-kelompok dan merangkum setiap kelompok.
Ini dilakukan di SQL menggunakan perintah GROUP BY. Perintah ini membagi data Anda ke dalam kelompok-kelompok dan menerapkan suatu fungsi dari pernyataan SELECT pada setiap kelompok.
Sebagai contoh, jika Anda ingin menghitung jumlah penerbangan dari masing-masing asal, Anda bisa menggunakan kueri berikut
SELECT COUNT(*) FROM flights
GROUP BY origin;
GROUP BY origin memberi tahu SQL bahwa Anda menginginkan keluaran memiliki satu baris untuk setiap nilai unik pada kolom origin. Pernyataan SELECT memilih nilai yang ingin Anda isikan ke setiap kolom. Di sini, kita ingin melakukan COUNT() pada setiap baris di tiap kelompok.
Anda bisa melakukan GROUP BY pada lebih dari satu kolom. Saat Anda melakukannya, tabel hasil akan memiliki satu baris untuk setiap kombinasi nilai unik di masing-masing kolom. Kueri berikut menghitung jumlah penerbangan dari SEA dan PDX ke setiap bandara tujuan:
SELECT origin, dest, COUNT(*) FROM flights
GROUP BY origin, dest;
Keluaran akan memiliki satu baris untuk setiap kombinasi nilai di origin dan dest (yakni, satu baris yang mencantumkan setiap asal dan tujuan yang diterbangi). Akan ada pula sebuah kolom dengan COUNT() dari semua baris di setiap kelompok.
Ingat, pembahasan SQL yang lebih mendalam dapat ditemukan di sini.
Informasi apa yang akan diperoleh kueri ini? Ingat bahwa tabel flights memuat informasi tentang penerbangan yang berangkat dari PDX dan SEA pada 2014 dan 2015. Perhatikan bahwa fungsi AVG() menghitung nilai rata-rata suatu kolom!
SELECT AVG(air_time) / 60 FROM flights
GROUP BY origin, carrier;
Latihan ini adalah bagian dari kursus
Dasar-Dasar PySpark
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga