Usando a funcionalidade da sua classe
Agora você adicionou uma funcionalidade extra ao método ` __init__ da sua classe Document `, que processa automaticamente o texto para os seus usuários. Neste exercício, você vai agir como um desses usuários para ver os benefícios do seu trabalho árduo.
A classe Document (copiada abaixo) foi carregada no seu ambiente (junto com as suas novas atualizações).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Este exercício faz parte do curso
Princípios de Engenharia de Software em Python
Instruções do exercício
- Crie uma nova instância do
Documenta partir do conjunto de dadosdatacamp_tweetscarregado no seu ambiente. O objeto `datacamp_tweets` é uma única string que contém centenas de tweets escritos por DataCamp e pelos usuários de DataCamp. - Imprima as primeiras 5 páginas de
tokensa partir dedatacamp_doc. - Imprima as 5 palavras mais comuns que foram calculadas automaticamente pelo método não público `
_count_words()no métodoDocument.__init__`.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))