1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zasady inżynierii oprogramowania w Pythonie

Connected

ćwiczenie

Korzystanie z funkcjonalności własnej klasy

Do metody __init__ klasy Document dodano teraz dodatkową funkcjonalność, która automatycznie przetwarza tekst dla użytkowników. W tym ćwiczeniu wcielisz się w rolę jednego z nich i przekonasz się, jakie korzyści daje ta praca.

Klasa Document (skopiowana poniżej) została załadowana do twojego środowiska (wraz z nowymi aktualizacjami).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Instrukcje

100 XP
  • Utwórz nową instancję klasy Document na podstawie zbioru danych datacamp_tweets załadowanego do twojego środowiska. Obiekt datacamp_tweets to pojedynczy ciąg znaków zawierający setki tweetów napisanych przez DataCamp i użytkowników DataCamp.
  • Wyświetl pierwsze 5 tokens z obiektu datacamp_doc.
  • Wyświetl 5 najczęściej występujących słów obliczonych automatycznie przez niepubliczną metodę _count_words() w metodzie Document.__init__.