LoslegenKostenlos loslegen

Textdaten für die Modelleingabe vorbereiten

Zuvor hast du gelernt, wie man Wörterbücher mit Indexen zu Wörtern und umgekehrt erstellt. In dieser Übung teilst du den Text nach Zeichen auf und machst die Daten weiter für das überwachte Lernen klar.

Texte in Zeichen aufzuteilen, klingt vielleicht komisch, wird aber oft gemacht, um Texte zu erstellen. Auch die Datenvorbereitung läuft genauso ab, nur die Aufteilung der Texte ist anders.

Du erstellst die Trainingsdaten mit einer Liste von Texten mit fester Länge und ihren Labels, also den nächsten Zeichen, die dazu gehören.

Du wirst weiterhin den Datensatz mit Zitaten von Sheldon (The Big Bang Theory) verwenden, der in der Variablen „ sheldon_quotes ” verfügbar ist.

Die Funktion „ print_examples() “ zeigt die Paare an, damit du sehen kannst, wie die Daten umgewandelt wurden. Mehr Infos findest du unter help().

Diese Übung ist Teil des Kurses

Rekursive neuronale Netze (RNNs) für die Sprachmodellierung mit Keras

Kurs anzeigen

Anleitung zur Übung

  • Sag mal, dass „ step ” dasselbe ist wie „ 2 ” und „ chars_window ” dasselbe wie „ 10 ”.
  • Füge den nächsten Satz an die Variable „ sentences “ an.
  • Füge die richtige Position des Textes „ sheldon “ an die Variable „ next_chars “ an.
  • Mit der Funktion „ print_examples() “ kannst du „ 10 “-Sätze und die nächsten Zeichen drucken.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create lists to keep the sentences and the next character
sentences = []   # ~ Training data
next_chars = []  # ~ Training labels

# Define hyperparameters
step = ____          # ~ Step to take when reading the texts in characters
chars_window = ____ # ~ Number of characters to use to predict the next one  

# Loop over the text: length `chars_window` per time with step equal to `step`
for i in range(0, len(sheldon_quotes) - chars_window, step):
    sentences.____(sheldon_quotes[i:i + chars_window])
    next_chars.append(sheldon_quotes[____])

# Print 10 pairs
print_examples(____, ____, 10)
Code bearbeiten und ausführen