Préparation des données
Vous développez un modèle de machine learning qui utilise le traitement du langage naturel (NLP) pour un projet d'analyse des sentiments visant à classer les avis sur les restaurants comme positifs, négatifs ou neutres. Afin de préparer les données pour l'entraînement, il est nécessaire de prétraiter et de représenter les données textuelles sous forme numérique.
Votre ensemble de données contient des milliers d'avis, dont l'un indique :
« Les plats étaient délicieux, mais le service était extrêmement lent. »
Quelles étapes de prétraitement du texte sont les plus susceptibles de supprimer les mots « mais » et « était » de cette critique ?
Cet exercice fait partie du cours
Concepts des grands modèles de langage (LLM)
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
