1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Principy softwarového inženýrství v Pythonu

Connected

cvičení

Využití funkcionality vlastní třídy

Do metody __init__ třídy Document jsi přidal/a další funkcionalitu, která automaticky zpracovává text za uživatele. V tomto cvičení si vyzkoušíš roli jednoho z těchto uživatelů a uvidíš, co tvoje práce přináší.

Třída Document (zkopírovaná níže) je načtena do tvého prostředí (včetně nových úprav).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Pokyny

100 XP
  • Vytvoř novou instanci třídy Document z datové sady datacamp_tweets načtené do tvého prostředí. Objekt datacamp_tweets je jeden řetězec obsahující stovky tweetů od DataCampu a jeho uživatelů.
  • Vypiš prvních 5 tokenů (tokens) z datacamp_doc.
  • Vypiš 5 nejčastějších slov, která automaticky vypočítala neveřejná metoda _count_words() v rámci metody Document.__init__.