Die Funktionalität deiner Klasse nutzen
Du hast jetzt zusätzliche Funktionalität zur __init__-Methode deiner Document-Klasse hinzugefügt, die Text automatisch für deine Nutzer verarbeitet. In dieser Übung schlüpfst du in die Rolle eines dieser Nutzer, um die Vorteile deiner Arbeit zu sehen.
Die Document-Klasse (unten kopiert) wurde in deine Umgebung geladen (inklusive deiner neuen Updates).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Diese Übung ist Teil des Kurses
Grundlagen der Softwareentwicklung in Python
Anleitung zur Übung
- Erstelle eine neue
Document-Instanz aus dem in deiner Umgebung geladenen Datensatzdatacamp_tweets. Das Objektdatacamp_tweetsist ein einzelner String mit Hunderten von Tweets, verfasst von DataCamp und DataCamp-Nutzern. - Gib die ersten 5
tokensvondatacamp_docaus. - Gib die 5 häufigsten Wörter aus, die von der nicht-öffentlichen Methode
_count_words()automatisch inDocument.__init__berechnet wurden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))