ComeçarComece de graça

Usando a funcionalidade da sua classe

Agora você adicionou uma funcionalidade extra ao método ` __init__ da sua classe Document `, que processa automaticamente o texto para os seus usuários. Neste exercício, você vai agir como um desses usuários para ver os benefícios do seu trabalho árduo.

A classe Document (copiada abaixo) foi carregada no seu ambiente (junto com as suas novas atualizações).

class Document:

  def __init__(self, text):

    self.text = text

    # pre tokenize the document with non-public tokenize method

    self.tokens = self._tokenize()

    # pre tokenize the document with non-public count_words

    self.word_counts = self._count_words()


  def _tokenize(self):

    return tokenize(self.text)



  # non-public method to tally document's word counts with Counter

  def _count_words(self):

    return Counter(self.tokens)

Este exercício faz parte do curso

Princípios de Engenharia de Software em Python

Ver curso

Instruções do exercício

  • Crie uma nova instância do Document a partir do conjunto de dados datacamp_tweets carregado no seu ambiente. O objeto ` datacamp_tweets ` é uma única string que contém centenas de tweets escritos por DataCamp e pelos usuários de DataCamp.
  • Imprima as primeiras 5 páginas de tokens a partir de datacamp_doc.
  • Imprima as 5 palavras mais comuns que foram calculadas automaticamente pelo método não público ` _count_words() no método Document.__init__ `.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Editar e executar o código