1. Apprendre
  2. /
  3. Cours
  4. /
  5. Principes d'ingénierie logicielle en Python

Connected

Exercice

Utiliser les fonctionnalités de votre classe

Vous avez ajouté de nouvelles fonctionnalités à la méthode __init__ de votre classe Document afin de traiter automatiquement le texte pour vos utilisatrices et utilisateurs. Dans cet exercice, vous vous placerez dans leur peau pour constater les avantages de votre travail.

La classe Document (recopiée ci-dessous) a été chargée dans votre environnement (avec vos nouvelles mises à jour).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Instructions

100 XP
  • Créez une nouvelle instance de Document à partir de l'ensemble de données datacamp_tweets chargé dans votre environnement. L'objet datacamp_tweets est une seule chaîne de caractères contenant des centaines de gazouillis rédigés par DataCamp et par des utilisatrices et utilisateurs de DataCamp.
  • Affichez les 5 premiers tokens de datacamp_doc.
  • Affichez les 5 mots les plus fréquents qui ont été calculés automatiquement par la méthode non publique _count_words() dans Document.__init__.