LoslegenKostenlos loslegen

Datensatz „20 News Groups“ erkunden

In dieser Übung bekommst du einen Ausschnitt aus dem Datensatz „20 News Groups“, den du mit der Funktion „ fetch_20newsgroups() “ von sklearn.datasets bekommen hast. Dabei wurden nur drei Klassen herausgefiltert: „ sci.space “, „ alt.atheism “ und „ soc.religion.christian “.

Der Datensatz wird in die Variable „ news_dataset “ geladen. Seine Eigenschaften werden angezeigt, sodass du sie in der Konsole checken kannst.

Mehr Infos zur Verwendung dieser Funktion findest du in der Sklearn-Dokumentation.

Du wirst die Texte tokenisieren und die Labels Schritt für Schritt One-Hot-codieren, um zu verstehen, wie die Transformationen ablaufen.

Diese Übung ist Teil des Kurses

Rekursive neuronale Netze (RNNs) für die Sprachmodellierung mit Keras

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# See example article
print(news_dataset.____[5])
Code bearbeiten und ausführen