BaşlayınÜcretsiz başlayın

Kaydedilmiş metinden bir bag oluşturma

Bu kez iş arkadaşın yorumları bazı metin dosyalarına kaydetti. Birden fazla dosya var ve her dosyada birden fazla yorum bulunuyor. Her yorum metin dosyasında ayrı bir satırda.

Bunları Dask ile tembel (lazy) şekilde yüklemek istiyorsun ki paralel işlemeyi kullanarak daha hızlı analiz edebilesin.

dask.bag senin için db olarak içe aktarıldı.

Bu egzersiz, kursun bir parçasıdır

Python ile Dask ile Paralel Programlama

Kursa Göz Atın

Egzersiz talimatları

  • read_text() fonksiyonunu kullanarak data/tripadvisor_hotel_reviews dizinindeki tüm .txt dosyalarını yükle.
  • Bag içindeki yorumların sayısını hesapla.
  • Sonucu yazdırmak için bag'in .compute() metodunu kullan.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____

# Count the number of reviews in the bag
review_count = review_bag.____

# Compute and print the answer
print(____)
Kodu Düzenle ve Çalıştır