BaşlayınÜcretsiz Başlayın

Sınıfının işlevselliğini kullanma

Artık Document sınıfının __init__ metoduna, kullanıcıların metnini otomatik olarak işleyen ek bir işlevsellik ekledin. Bu egzersizde, sıkı çalışmanın faydalarını görmek için o kullanıcılardan biri gibi davranacaksın.

Document sınıfı (aşağıya kopyalanmıştır) ortamına yüklendi (yeni güncellemelerinle birlikte).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Bu egzersiz

Python'da Yazılım Mühendisliği İlkeleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Ortamına yüklenmiş olan datacamp_tweets veri kümesinden yeni bir Document örneği oluştur. datacamp_tweets nesnesi, DataCamp ve DataCamp kullanıcıları tarafından yazılmış yüzlerce tweet içeren tek bir string’dir.
  • datacamp_doc içindeki ilk 5 tokens değerini yazdır.
  • Document.__init__ metodunda otomatik olarak çalışan, herkese açık olmayan _count_words() yöntemiyle hesaplanan en yaygın 5 kelimeyi yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Kodu Düzenle ve Çalıştır