Normalisation par lots

Comme dernière amélioration de l'architecture du modèle, ajoutons la couche de normalisation des lots après chacune des deux couches linéaires. L'astuce de la norme par lot tend à accélérer la convergence de l'apprentissage et protège le modèle des problèmes de disparition et d'explosion des gradients.

Les deux sites torch.nn et torch.nn.init ont déjà été importés pour vous en tant que nn et init, respectivement. Une fois que vous aurez mis en œuvre le changement dans l'architecture du modèle, soyez prêt à répondre à une courte question sur le fonctionnement de la normalisation des lots !

Cet exercice fait partie du cours

Deep learning intermédiaire avec PyTorch

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(9, 16)
        # Add two batch normalization layers
        ____ = ____
        self.fc2 = nn.Linear(16, 8)
        ____ = ____
        self.fc3 = nn.Linear(8, 1)
        
        init.kaiming_uniform_(self.fc1.weight)
        init.kaiming_uniform_(self.fc2.weight)
        init.kaiming_uniform_(self.fc3.weight, nonlinearity="sigmoid")

Modifier et exécuter le code

Cet exercice fait partie du cours

Deep learning intermédiaire avec PyTorch

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Apprenez à former des réseaux neuronaux de manière robuste. Dans ce chapitre, vous utiliserez la programmation orientée objet pour définir les ensembles de données et les modèles PyTorch et rafraîchir vos connaissances en matière de formation et d'évaluation des réseaux neuronaux. Vous vous familiariserez également avec différents optimiseurs et, enfin, avec diverses techniques permettant d'atténuer les problèmes d'instabilité des gradients, si omniprésents dans la formation des réseaux neuronaux.

Exercise 1: PyTorch et la programmation orientée objet Exercise 2: Ensemble de données PyTorch Exercise 3: PyTorch DataLoader Exercise 4: Modèle PyTorch Exercise 5: Optimiseurs, formation et évaluation Exercise 6: Boucle de formation Exercise 7: Optimiseurs Exercise 8: Évaluation du modèle Exercise 9: Dégradés disparaissants et explosifs Exercise 10: Initialisation et activation Exercise 11: Activations : ReLU vs. ELU Exercise 12: Normalisation par lots

Exercice en cours

Entraînez des réseaux neuronaux pour résoudre des tâches de classification d'images. Dans ce chapitre, vous apprendrez à manipuler des données d'images dans PyTorch et à vous familiariser avec les réseaux neuronaux convolutifs (CNN). Vous vous entraînerez à former et à évaluer un classificateur d'images tout en apprenant comment améliorer les performances du modèle grâce à l'augmentation des données.

Exercise 1: Manipuler des images avec PyTorch Exercise 2: Ensemble de données d'images Exercise 3: Augmentation des données Exercise 4: Augmentation des données dans PyTorch Exercise 5: Réseaux neuronaux convolutifs Exercise 6: La couche convolutive Exercise 7: Construire des réseaux convolutifs Exercise 8: Formation de classificateurs d'images Exercise 9: Choix des augmentations Exercise 10: Ensemble de données avec augmentations Exercise 11: Boucle d'apprentissage du classificateur d'images Exercise 12: Évaluation des classificateurs d'images Exercise 13: Évaluation de modèles multi-classes Exercise 14: Analyse des métriques par classe

Créez et formez des réseaux neuronaux récurrents (RNN) pour traiter des données séquentielles telles que des séries temporelles, du texte ou des fichiers audio. Vous découvrirez les deux architectures récurrentes les plus populaires, les réseaux Long-Short Term Memory (LSTM) et Gated Recurrent Unit (GRU), ainsi que la manière de préparer des données séquentielles pour l'apprentissage du modèle. Vous mettrez vos compétences en pratique en formant et en évaluant un modèle récurrent de prévision de la consommation d'électricité.

Exercise 1: Manipuler des séquences avec PyTorch Exercise 2: Générer des séquences Exercise 3: Ensemble de données séquentielles Exercise 4: Réseaux neuronaux récurrents Exercise 5: Architectures séquentielles Exercise 6: Construire un système de prévision RNN Exercise 7: LSTM et GRU cellules Exercise 8: RNN vs. LSTM vs. GRU Exercise 9: LSTM réseau Exercise 10: GRU réseau Exercise 11: Formation et évaluation des RNN Exercise 12: RNN boucle de formation Exercise 13: Évaluation des modèles de prévision

Construire des modèles à entrées et sorties multiples, en démontrant comment ils peuvent gérer des tâches nécessitant plus d'une entrée ou générant des sorties multiples. Vous découvrirez comment concevoir et entraîner ces modèles à l'aide de PyTorch et vous vous pencherez sur le sujet crucial de la pondération des pertes dans les modèles à sorties multiples. Il s'agit de comprendre comment équilibrer l'importance des différentes tâches lors de la formation d'un modèle à l'exécution simultanée de plusieurs tâches.

Exercise 1: Modèles à entrées multiples Exercise 2: Ensemble de données à deux entrées Exercise 3: Modèle à deux entrées Exercise 4: Formation d'un modèle à deux entrées Exercise 5: Modèles à sorties multiples Exercise 6: Dataset et DataLoader à deux sorties Exercise 7: Architecture du modèle à deux sorties Exercise 8: Formation de modèles à sorties multiples Exercise 9: Évaluation des modèles à sorties multiples et pondération des pertes Exercise 10: Évaluation d'un modèle à sorties multiples Exercise 11: Pondération des pertes Exercise 12: Conclusion