CommencerCommencer gratuitement

Racines et lemmes à partir de GoT

Dans cet exercice, vous disposez de quelques phrases tirées du Game of Thrones de George R. R. Martin. Votre tâche est de créer des racines (stems) et des lemmes à partir de la chaîne GoT fournie.

Rappelez-vous que le stemming réduit un mot à sa racine, tandis que la lemmatisation produit un mot existant. En revanche, la vitesse peut varier fortement entre les deux méthodes : le stemming est bien plus rapide. Aux étapes 2 et 3, prêtez attention au temps total nécessaire pour chaque opération. Nous utilisons la méthode time.time() pour mesurer le temps d’exécution du stemming et de la lemmatisation.

Cet exercice fait partie du cours

Analyse de sentiments en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the required packages from nltk
from nltk.stem import ____, ____
from nltk import word_tokenize

porter = PorterStemmer()
WNlemmatizer = WordNetLemmatizer()

# Tokenize the GoT string
tokens = ____(GoT) 
Modifier et exécuter le code