Penyaringan Data dengan PySpark
Dalam latihan ini, kita akan mengunggah sebuah file ke lakehouse dan menggunakan PySpark untuk menyaring data. File tersebut berisi daftar gim video dan penerbitnya. Kita ingin mereduksi himpunan data sehingga kita hanya menangani gim video dari penerbit Atari.
Catatan: Jika Anda mendapatkan error tentang batas laju API, ini biasanya terjadi karena tugas Fabric sebelumnya belum selesai. Anda dapat melihat tugas Fabric yang aktif dari halaman Monitor (terletak pada menu vertikal di sebelah kiri). Membatalkan tugas Fabric lama di halaman Monitor biasanya akan menyelesaikan error batas laju tersebut.
Latihan ini adalah bagian dari kursus
Transformasi dan Analisis Data dengan Microsoft Fabric
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga