Kaydedilmiş metinden bir bag oluşturma
Bu kez iş arkadaşın yorumları bazı metin dosyalarına kaydetti. Birden fazla dosya var ve her dosyada birden fazla yorum bulunuyor. Her yorum metin dosyasında ayrı bir satırda.
Bunları Dask ile tembel (lazy) şekilde yüklemek istiyorsun ki paralel işlemeyi kullanarak daha hızlı analiz edebilesin.
dask.bag senin için db olarak içe aktarıldı.
Bu egzersiz
Python ile Dask ile Paralel Programlama
kursunun bir parçasıdırEgzersiz talimatları
read_text()fonksiyonunu kullanarakdata/tripadvisor_hotel_reviewsdizinindeki tüm.txtdosyalarını yükle.- Bag içindeki yorumların sayısını hesapla.
- Sonucu yazdırmak için bag'in
.compute()metodunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____
# Count the number of reviews in the bag
review_count = review_bag.____
# Compute and print the answer
print(____)