Usando a funcionalidade de sua classe
Agora você adicionou uma funcionalidade adicional ao método __init__
da classe Document
que processa automaticamente o texto para os usuários. Neste exercício, você atuará como um desses usuários para ver os benefícios do seu trabalho árduo.
A classe Document
(copiada abaixo) foi carregada em seu ambiente (completa com as novas atualizações).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Este exercício faz parte do curso
Princípios de engenharia de software em Python
Instruções de exercício
- Crie uma nova instância
Document
a partir do conjunto de dadosdatacamp_tweets
carregado em seu ambiente. O objetodatacamp_tweets
é uma string única que contém centenas de tweets escritos por usuários da DataCamp e da DataCamp. - Imprima os primeiros 5
tokens
dedatacamp_doc
. - Imprima as 5 principais palavras mais comuns que foram calculadas pelo método não público
_count_words()
automaticamente no métodoDocument.__init__
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))