BaşlayınÜcretsiz Başlayın

Kaydedilmiş metinden bir bag oluşturma

Bu kez iş arkadaşın yorumları bazı metin dosyalarına kaydetti. Birden fazla dosya var ve her dosyada birden fazla yorum bulunuyor. Her yorum metin dosyasında ayrı bir satırda.

Bunları Dask ile tembel (lazy) şekilde yüklemek istiyorsun ki paralel işlemeyi kullanarak daha hızlı analiz edebilesin.

dask.bag senin için db olarak içe aktarıldı.

Bu egzersiz

Python ile Dask ile Paralel Programlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • read_text() fonksiyonunu kullanarak data/tripadvisor_hotel_reviews dizinindeki tüm .txt dosyalarını yükle.
  • Bag içindeki yorumların sayısını hesapla.
  • Sonucu yazdırmak için bag'in .compute() metodunu kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____

# Count the number of reviews in the bag
review_count = review_bag.____

# Compute and print the answer
print(____)
Kodu Düzenle ve Çalıştır