Votre premier TfIdf
Dans cet exercice, vous allez appliquer la méthode TfIdf au petit jeu de données annak, qui contient la première phrase d’Anna Karénine de Léon Tolstoï.
Votre tâche consiste à utiliser ce jeu de données et à appliquer la fonction TfidfVectorizer(). Rappelez-vous que transformer du texte en valeurs numériques est la première étape pour comprendre le sentiment exprimé. Le vectoriseur Tfidf est une autre manière de construire un vocabulaire à partir de notre colonne de sentiments.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Instructions
- Importez la fonction permettant de construire un vectoriseur TfIdf depuis
sklearn.feature_extraction.text. - Appelez la fonction
TfidfVectorizer()et ajustez-la (fit) sur le jeu de donnéesannak. - Transformez le vectoriseur.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the required function
____
annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']
# Call the vectorizer and fit it
anna_vect = ____.___(annak)
# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)
# Print the result
print(anna_tfidf.toarray())