CommencerCommencer gratuitement

Votre premier TfIdf

Dans cet exercice, vous allez appliquer la méthode TfIdf au petit jeu de données annak, qui contient la première phrase d’Anna Karénine de Léon Tolstoï.

Votre tâche consiste à utiliser ce jeu de données et à appliquer la fonction TfidfVectorizer(). Rappelez-vous que transformer du texte en valeurs numériques est la première étape pour comprendre le sentiment exprimé. Le vectoriseur Tfidf est une autre manière de construire un vocabulaire à partir de notre colonne de sentiments.

Cet exercice fait partie du cours

Analyse de sentiments en Python

Afficher le cours

Instructions

  • Importez la fonction permettant de construire un vectoriseur TfIdf depuis sklearn.feature_extraction.text.
  • Appelez la fonction TfidfVectorizer() et ajustez-la (fit) sur le jeu de données annak.
  • Transformez le vectoriseur.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the required function
____

annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']

# Call the vectorizer and fit it
anna_vect = ____.___(annak)

# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)

# Print the result 
print(anna_tfidf.toarray())
Modifier et exécuter le code