ComeçarComece gratuitamente

Usando a funcionalidade de sua classe

Agora você adicionou uma funcionalidade adicional ao método __init__ da classe Document que processa automaticamente o texto para os usuários. Neste exercício, você atuará como um desses usuários para ver os benefícios do seu trabalho árduo.

A classe Document (copiada abaixo) foi carregada em seu ambiente (completa com as novas atualizações).

class Document:

  def __init__(self, text):

    self.text = text

    # pre tokenize the document with non-public tokenize method

    self.tokens = self._tokenize()

    # pre tokenize the document with non-public count_words

    self.word_counts = self._count_words()


  def _tokenize(self):

    return tokenize(self.text)



  # non-public method to tally document's word counts with Counter

  def _count_words(self):

    return Counter(self.tokens)

Este exercício faz parte do curso

Princípios de engenharia de software em Python

Ver Curso

Instruções de exercício

  • Crie uma nova instância Document a partir do conjunto de dados datacamp_tweets carregado em seu ambiente. O objeto datacamp_tweets é uma string única que contém centenas de tweets escritos por usuários da DataCamp e da DataCamp.
  • Imprima os primeiros 5 tokens de datacamp_doc.
  • Imprima as 5 principais palavras mais comuns que foram calculadas pelo método não público _count_words() automaticamente no método Document.__init__.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Editar e executar código