Usare le funzionalità della tua classe
Hai aggiunto nuove funzionalità al metodo __init__ della tua classe Document che elaborano automaticamente il testo per chi la utilizza. In questo esercizio, assumerai il ruolo di uno di questi utenti per apprezzare i benefici del tuo lavoro.
La classe Document (riportata qui sotto) è stata caricata nel tuo ambiente (comprensiva dei tuoi nuovi aggiornamenti).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Questo esercizio fa parte del corso
Principi di Ingegneria del Software in Python
Istruzioni dell'esercizio
- Crea una nuova istanza di
Documenta partire dall'insieme di datidatacamp_tweetscaricato nel tuo ambiente. L'oggettodatacamp_tweetsè una singola stringa che contiene centinaia di tweet scritti da DataCamp e dagli utenti di DataCamp. - Stampa i primi 5
tokensdidatacamp_doc. - Stampa le 5 parole più comuni calcolate automaticamente dal metodo non pubblico
_count_words()all'interno diDocument.__init__.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))