De functionaliteit van je klasse gebruiken
Je hebt nu extra functionaliteit toegevoegd aan de __init__-methode van je Document-klasse die automatisch tekst verwerkt voor je gebruikers. In deze oefening kruip je in de huid van zo’n gebruiker om de voordelen van je werk te zien.
De Document-klasse (hieronder gekopieerd) is in je omgeving geladen (inclusief je nieuwe updates).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Deze oefening maakt deel uit van de cursus
Software-engineeringprincipes in Python
Oefeninstructies
- Maak een nieuwe
Document-instantie van de gegevenssetdatacamp_tweetsdie in je omgeving is geladen. Het objectdatacamp_tweetsis één string met honderden tweets van DataCamp en DataCamp-gebruikers. - Print de eerste 5
tokensvandatacamp_doc. - Print de 5 meest voorkomende woorden die automatisch zijn berekend door de niet-publieke methode
_count_words()inDocument.__init__.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))