Aan de slagGa gratis aan de slag

De functionaliteit van je klasse gebruiken

Je hebt nu extra functionaliteit toegevoegd aan de __init__-methode van je Document-klasse die automatisch tekst verwerkt voor je gebruikers. In deze oefening kruip je in de huid van zo’n gebruiker om de voordelen van je werk te zien.

De Document-klasse (hieronder gekopieerd) is in je omgeving geladen (inclusief je nieuwe updates).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Deze oefening maakt deel uit van de cursus

Software-engineeringprincipes in Python

Cursus bekijken

Oefeninstructies

  • Maak een nieuwe Document-instantie van de gegevensset datacamp_tweets die in je omgeving is geladen. Het object datacamp_tweets is één string met honderden tweets van DataCamp en DataCamp-gebruikers.
  • Print de eerste 5 tokens van datacamp_doc.
  • Print de 5 meest voorkomende woorden die automatisch zijn berekend door de niet-publieke methode _count_words() in Document.__init__.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Code bewerken en uitvoeren