Exploration du jeu de données 20 News Groups
Dans cet exercice, vous allez travailler sur un échantillon du jeu de données 20 News Groups obtenu avec la fonction fetch_20newsgroups() de sklearn.datasets, en ne gardant que trois classes : sci.space, alt.atheism et soc.religion.christian.
Le jeu de données est chargé dans la variable news_dataset. Ses attributs sont affichés afin que vous puissiez les explorer dans la console.
Pour plus de détails sur l’utilisation de cette fonction, consultez la documentation Sklearn.
Vous allez tokeniser les textes et encoder les étiquettes en one-hot pas à pas pour comprendre comment s’opèrent les transformations.
Cet exercice fait partie du cours
Réseaux de neurones récurrents (RNN) pour la modélisation du langage avec Keras
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# See example article
print(news_dataset.____[5])