Kaydedilmiş metinden bir bag oluşturma
Bu kez iş arkadaşın yorumları bazı metin dosyalarına kaydetti. Birden fazla dosya var ve her dosyada birden fazla yorum bulunuyor. Her yorum metin dosyasında ayrı bir satırda.
Bunları Dask ile tembel (lazy) şekilde yüklemek istiyorsun ki paralel işlemeyi kullanarak daha hızlı analiz edebilesin.
dask.bag senin için db olarak içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
Python ile Dask ile Paralel Programlama
Egzersiz talimatları
read_text()fonksiyonunu kullanarakdata/tripadvisor_hotel_reviewsdizinindeki tüm.txtdosyalarını yükle.- Bag içindeki yorumların sayısını hesapla.
- Sonucu yazdırmak için bag'in
.compute()metodunu kullan.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____
# Count the number of reviews in the bag
review_count = review_bag.____
# Compute and print the answer
print(____)