Mulai sekarangMulai gratis

Membuat bag dari teks yang disimpan

Kali ini rekan Anda telah menyimpan ulasan ke beberapa file teks. Ada banyak file dan banyak ulasan di setiap file. Setiap ulasan berada pada baris terpisah di dalam file teks.

Anda ingin memuatnya ke Dask secara lazy agar dapat menggunakan pemrosesan paralel untuk menganalisisnya lebih cepat.

dask.bag telah diimpor untuk Anda sebagai db.

Latihan ini merupakan bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Instruksi latihan

  • Gunakan fungsi read_text() untuk memuat semua file .txt di dalam direktori data/tripadvisor_hotel_reviews.
  • Hitung jumlah ulasan di dalam bag.
  • Gunakan metode .compute() milik bag untuk mencetak jawabannya.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____

# Count the number of reviews in the bag
review_count = review_bag.____

# Compute and print the answer
print(____)
Edit dan Jalankan Kode