1. Learn
  2. /
  3. Cursuri
  4. /
  5. Principii de inginerie software în Python

Connected

exercițiu

Folosirea funcționalității clasei tale

Ai adăugat funcționalitate suplimentară metodei __init__ a clasei Document, astfel încât textul să fie procesat automat pentru utilizatori. În acest exercițiu, vei juca rolul unuia dintre acești utilizatori pentru a vedea beneficiile muncii tale.

Clasa Document (copiată mai jos) a fost încărcată în mediul tău de lucru (cu toate actualizările noi).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Instrucțiuni

100 XP
  • Creează o nouă instanță Document din setul de date datacamp_tweets încărcat în mediul tău de lucru. Obiectul datacamp_tweets este un șir unic de caractere care conține sute de tweet-uri scrise de DataCamp și utilizatorii DataCamp.
  • Afișează primele 5 tokens din datacamp_doc.
  • Afișează cele mai frecvente 5 cuvinte calculate automat de metoda non-publică _count_words() în metoda Document.__init__.