Overfitting erkennen

In dieser Übung arbeiten wir mit einem kleinen Teil der Beispiele aus dem ursprünglichen Datensatz mit Buchstaben der Gebärdensprache. Eine kleine Stichprobe in Kombination mit einem stark parametrisierten Modell führt in der Regel zu Overfitting. Das bedeutet, dass dein Modell sich nur die Klasse jedes einzelnen Beispiels merkt, statt Merkmale zu identifizieren, die auf viele Beispiele verallgemeinern.

Du erkennst Overfitting, indem du prüfst, ob der Validierungsverlust deutlich höher ist als der Trainingsverlust und ob er mit weiterem Training zunimmt. Bei einer kleinen Stichprobe und einer hohen Lernrate fällt es dem Modell schwer, zu einem Optimum zu konvergieren. Du setzt eine niedrige Lernrate für den Optimierer, was es einfacher macht, Overfitting zu erkennen.

Beachte, dass keras aus tensorflow importiert wurde.

Diese Übung ist Teil des Kurses

Einführung in TensorFlow mit Python

Anleitung zur Übung

Definiere in keras ein sequenzielles Modell mit dem Namen model.
Füge eine erste dichte Schicht mit 1024 Knoten, einer relu-Aktivierung und einer Input-Form von (784,) hinzu.
Setze die Lernrate auf 0,001.
Lege fest, dass fit() 50-mal über die vollständige Stichprobe iteriert und 50 % der Stichprobe für die Validierung verwendet.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define sequential model
____

# Define the first layer
____

# Add activation function to classifier
model.add(keras.layers.Dense(4, activation='softmax'))

# Finish the model compilation
model.compile(optimizer=keras.optimizers.Adam(lr=____), 
              loss='categorical_crossentropy', metrics=['accuracy'])

# Complete the model fit operation
model.fit(sign_language_features, sign_language_labels, epochs=____, validation_split=____)

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Einführung in TensorFlow mit Python

Mittlere SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

Bevor du fortgeschrittene Modelle in TensorFlow 2 bauen kannst, brauchst du zunächst die Grundlagen. In diesem Kapitel lernst du, wie du Konstanten und Variablen definierst, Tensoren addierst und multiplizierst und Ableitungen berechnest. Kenntnisse in linearer Algebra sind hilfreich, aber nicht zwingend erforderlich.

Exercise 1: Konstanten und Variablen Exercise 2: Daten als Konstanten definieren Exercise 3: Variablen definieren Exercise 4: Grundlegende Operationen Exercise 5: Elementweise Multiplikation durchführen Exercise 6: Vorhersagen mit Matrixmultiplikation Exercise 7: Über Tensor-Dimensionen summieren Exercise 8: Fortgeschrittene Operationen Exercise 9: Tensors umformen Exercise 10: Mit Gradienten optimieren Exercise 11: Mit Bilddaten arbeiten

In diesem Kapitel lernst du, wie du in TensorFlow 2 Modelle aufbaust, löst und Vorhersagen damit triffst. Der Fokus liegt auf einer einfachen Modellklasse – dem linearen Regressionsmodell – und du versuchst, Immobilienpreise vorherzusagen. Am Ende des Kapitels weißt du, wie du Daten lädst und aufbereitest, Verlustfunktionen konstruierst, Minimierung durchführst, Vorhersagen machst und mit Batch-Training Ressourcen sparst.

Exercise 1: Eingabedaten Exercise 2: Daten mit pandas laden Exercise 3: Den Datentyp festlegen Exercise 4: Verlustfunktionen Exercise 5: Loss-Funktionen in TensorFlow Exercise 6: Die Verlustfunktion anpassen Exercise 7: Lineare Regression Exercise 8: Lineare Regression einrichten Exercise 9: Ein lineares Modell trainieren Exercise 10: Multiple lineare Regression Exercise 11: Batch-Training Exercise 12: Vorbereitung auf Batch-Training Exercise 13: Ein lineares Modell in Batches trainieren

In den vorherigen Kapiteln hast du gelernt, wie man in TensorFlow 2 Modelle erstellt. In diesem Kapitel wendest du dieselben Werkzeuge an, um neuronale Netze zu bauen, zu trainieren und damit Vorhersagen zu treffen. Du lernst, dichte Schichten zu definieren, Aktivierungsfunktionen anzuwenden, einen Optimierer zu wählen und Regularisierung einzusetzen, um Overfitting zu reduzieren. Du nutzt die Flexibilität von TensorFlow, indem du sowohl Operationen der linearen Algebra auf Low-Level als auch die High-Level-Keras-API verwendest, um Modelle zu definieren und zu trainieren.

Exercise 1: Dichte Schichten Exercise 2: Die Lineare Algebra dichter Schichten Exercise 3: Der Low-Level-Ansatz mit mehreren Beispielen Exercise 4: Die Dense-Layer-Operation verwenden Exercise 5: Aktivierungsfunktionen Exercise 6: Binäre Klassifikationsprobleme Exercise 7: Multiclass-Klassifikationsprobleme Exercise 8: Optimierer Exercise 9: Die Tücken lokaler Minima Exercise 10: Lokale Minima vermeiden Exercise 11: Ein Netzwerk in TensorFlow trainieren Exercise 12: Initialisierung in TensorFlow Exercise 13: Modell und Verlustfunktion definieren Exercise 14: Neuronale Netze mit TensorFlow trainieren

Im letzten Kapitel verwendest du High-Level-APIs in TensorFlow 2, um einen Klassifikator für Buchstaben in der Gebärdensprache zu trainieren. Du nutzt sowohl die sequenziellen als auch die funktionalen Keras-APIs, um Modelle zu trainieren, zu validieren, Vorhersagen zu treffen und zu evaluieren. Außerdem lernst du, wie du die Estimators-API verwendest, um die Modelldefinition und den Trainingsprozess zu straffen und Fehler zu vermeiden.

Exercise 1: Neuronale Netze mit Keras definieren Exercise 2: Das sequenzielle Modell in Keras Exercise 3: Ein sequenzielles Modell kompilieren Exercise 4: Ein Modell mit mehreren Eingaben definieren Exercise 5: Training und Validierung mit Keras Exercise 6: Training mit Keras Exercise 7: Metriken und Validierung mit Keras Exercise 8: Overfitting erkennen

Aktuelle Übung

Exercise 9: Modelle auswerten Exercise 10: Modelle mit der Estimators-API trainieren Exercise 11: Vorbereitung auf das Training mit Estimators Exercise 12: Estimator definieren Exercise 13: Glückwunsch!