Préparation des données
Vous développez un modèle de machine learning qui utilise le traitement du langage naturel (NLP) pour un projet d'analyse des sentiments visant à classer les avis sur les restaurants comme positifs, négatifs ou neutres. Afin de préparer les données pour l'entraînement, il est nécessaire de prétraiter et de représenter les données textuelles sous forme numérique.
Votre ensemble de données contient des milliers d'avis, dont l'un indique :
« Les plats étaient délicieux, mais le service était extrêmement lent. »
Quelles étapes de prétraitement du texte sont les plus susceptibles de supprimer les mots « mais » et « était » de cette critique ?
Cet exercice fait partie du cours
<cours>Concepts des grands modèles de langage (LLM)</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice