Sınıfının işlevselliğini kullanma
Artık Document sınıfının __init__ metoduna, kullanıcıların metnini otomatik olarak işleyen ek bir işlevsellik ekledin. Bu egzersizde, sıkı çalışmanın faydalarını görmek için o kullanıcılardan biri gibi davranacaksın.
Document sınıfı (aşağıya kopyalanmıştır) ortamına yüklendi (yeni güncellemelerinle birlikte).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Bu egzersiz
Python'da Yazılım Mühendisliği İlkeleri
kursunun bir parçasıdırEgzersiz talimatları
- Ortamına yüklenmiş olan
datacamp_tweetsveri kümesinden yeni birDocumentörneği oluştur.datacamp_tweetsnesnesi, DataCamp ve DataCamp kullanıcıları tarafından yazılmış yüzlerce tweet içeren tek bir string’dir. datacamp_dociçindeki ilk 5tokensdeğerini yazdır.Document.__init__metodunda otomatik olarak çalışan, herkese açık olmayan_count_words()yöntemiyle hesaplanan en yaygın 5 kelimeyi yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))