LoslegenKostenlos loslegen

Die Funktionalität deiner Klasse nutzen

Du hast jetzt zusätzliche Funktionalität zur __init__-Methode deiner Document-Klasse hinzugefügt, die Text automatisch für deine Nutzer verarbeitet. In dieser Übung schlüpfst du in die Rolle eines dieser Nutzer, um die Vorteile deiner Arbeit zu sehen.

Die Document-Klasse (unten kopiert) wurde in deine Umgebung geladen (inklusive deiner neuen Updates).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Diese Übung ist Teil des Kurses

Grundlagen der Softwareentwicklung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine neue Document-Instanz aus dem in deiner Umgebung geladenen Datensatz datacamp_tweets. Das Objekt datacamp_tweets ist ein einzelner String mit Hunderten von Tweets, verfasst von DataCamp und DataCamp-Nutzern.
  • Gib die ersten 5 tokens von datacamp_doc aus.
  • Gib die 5 häufigsten Wörter aus, die von der nicht-öffentlichen Methode _count_words() automatisch in Document.__init__ berechnet wurden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Code bearbeiten und ausführen