Membuat bag dari teks yang disimpan
Kali ini rekan Anda telah menyimpan ulasan ke beberapa file teks. Ada banyak file dan banyak ulasan di setiap file. Setiap ulasan berada pada baris terpisah di dalam file teks.
Anda ingin memuatnya ke Dask secara lazy agar dapat menggunakan pemrosesan paralel untuk menganalisisnya lebih cepat.
dask.bag telah diimpor untuk Anda sebagai db.
Latihan ini adalah bagian dari kursus
Pemrograman Paralel dengan Dask di Python
Petunjuk latihan
- Gunakan fungsi
read_text()untuk memuat semua file.txtdi dalam direktoridata/tripadvisor_hotel_reviews. - Hitung jumlah ulasan di dalam bag.
- Gunakan metode
.compute()milik bag untuk mencetak jawabannya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____
# Count the number of reviews in the bag
review_count = review_bag.____
# Compute and print the answer
print(____)