IniziaInizia gratis

Usare le funzionalità della tua classe

Hai aggiunto nuove funzionalità al metodo __init__ della tua classe Document che elaborano automaticamente il testo per chi la utilizza. In questo esercizio, assumerai il ruolo di uno di questi utenti per apprezzare i benefici del tuo lavoro.

La classe Document (riportata qui sotto) è stata caricata nel tuo ambiente (comprensiva dei tuoi nuovi aggiornamenti).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Questo esercizio fa parte del corso

Principi di Ingegneria del Software in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una nuova istanza di Document a partire dall'insieme di dati datacamp_tweets caricato nel tuo ambiente. L'oggetto datacamp_tweets è una singola stringa che contiene centinaia di tweet scritti da DataCamp e dagli utenti di DataCamp.
  • Stampa i primi 5 tokens di datacamp_doc.
  • Stampa le 5 parole più comuni calcolate automaticamente dal metodo non pubblico _count_words() all'interno di Document.__init__.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Modifica ed esegui il codice