Evitar mínimos locais

O problema anterior mostrou como é fácil ficar preso em mínimos locais. Tínhamos um problema de otimização simples em uma variável e a descida do gradiente ainda não conseguiu atingir o mínimo global quando tivemos que percorrer os mínimos locais primeiro. Uma maneira de evitar esse problema é usar o momentum, que permite que o otimizador ultrapasse os mínimos locais. Usaremos novamente a função de perda do problema anterior, que foi definida e está disponível para você em loss_function().

O gráfico é de uma função de variável única que contém vários mínimos locais e um mínimo global.

Vários otimizadores em tensorflow têm um parâmetro de momentum, incluindo SGD e RMSprop. Você usará o site RMSprop neste exercício. Observe que x_1 e x_2 foram inicializados com o mesmo valor desta vez. Além disso, keras.optimizers.RMSprop() também foi importado para você de tensorflow.

Este exercício faz parte do curso

Introdução ao TensorFlow em Python

Instruções do exercício

Defina a operação opt_1 para usar uma taxa de aprendizado de 0,01 e um momento de 0,99.
Defina o site opt_2 para usar o otimizador de propagação de raiz quadrada média (RMS) com uma taxa de aprendizado de 0,01 e um momentum de 0,00.
Defina a operação de minimização para opt_2.
Imprima x_1 e x_2 como matrizes numpy.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize x_1 and x_2
x_1 = Variable(0.05,float32)
x_2 = Variable(0.05,float32)

# Define the optimization operation for opt_1 and opt_2
opt_1 = keras.optimizers.RMSprop(learning_rate=____, momentum=____)
opt_2 = ____

for j in range(100):
	opt_1.minimize(lambda: loss_function(x_1), var_list=[x_1])
    # Define the minimization operation for opt_2
	____

# Print x_1 and x_2 as numpy arrays
print(____, ____)

Editar e executar o código

Este exercício faz parte do curso

Introdução ao TensorFlow em Python

IntermediárioNível de habilidade

4.8+

Iniciar curso de graça

Antes de criar modelos avançados no TensorFlow 2, você precisa primeiro entender os conceitos básicos. Neste capítulo, você aprenderá a definir constantes e variáveis, realizar adição e multiplicação de tensores e calcular derivadas. Conhecimento de álgebra linear será útil, mas não necessário.

Exercise 1: Constantes e variáveis Exercise 2: Definição de dados como constantes Exercise 3: Definição de variáveis Exercise 4: Operações básicas Exercise 5: Realização de multiplicação por elementos Exercise 6: Fazer previsões com a multiplicação de matrizes Exercise 7: Somando as dimensões do tensor Exercise 8: Operações avançadas Exercise 9: Reformulação de tensores Exercise 10: Otimização com gradientes Exercise 11: Trabalho com dados de imagem

Neste capítulo, você aprenderá a criar, resolver e fazer previsões com modelos no TensorFlow 2. Você se concentrará em uma classe simples de modelos - o modelo de regressão linear - e tentará prever os preços das moradias. Ao final do capítulo, você saberá como carregar e manipular dados, construir funções de perda, realizar minimização, fazer previsões e reduzir o uso de recursos com treinamento em lote.

Exercise 1: Dados de entrada Exercise 2: Carregar dados usando pandas Exercise 3: Definir o tipo de dados Exercise 4: Funções de perda Exercise 5: Funções de perda no TensorFlow Exercise 6: Modificação da função de perda Exercise 7: Regressão linear Exercise 8: Configure uma regressão linear Exercise 9: Treinar um modelo linear Exercise 10: Regressão linear múltipla Exercise 11: Treinamento em lote Exercise 12: Preparando-se para o treinamento em lote Exercise 13: Treinamento de um modelo linear em lotes

Os capítulos anteriores ensinaram a você como criar modelos no TensorFlow 2. Neste capítulo, você aplicará essas mesmas ferramentas para criar, treinar e fazer previsões com redes neurais. Você aprenderá a definir camadas densas, aplicar funções de ativação, selecionar um otimizador e aplicar regularização para reduzir o excesso de ajuste. Você aproveitará a flexibilidade do TensorFlow usando álgebra linear de baixo nível e operações de alto nível do Keras API para definir e treinar modelos.

Exercise 1: Camadas densas Exercise 2: A álgebra linear de camadas densas Exercise 3: A abordagem de baixo nível com vários exemplos Exercise 4: Usando a operação de camada densa Exercise 5: Funções de ativação Exercise 6: Problemas de classificação binária Exercise 7: Problemas de classificação multiclasse Exercise 8: Otimizadores Exercise 9: Os perigos dos mínimos locais Exercise 10: Evitar mínimos locais

Exercício atual

Exercise 11: Treinamento de uma rede no TensorFlow Exercise 12: Inicialização no TensorFlow Exercise 13: Definição do modelo e da função de perda Exercise 14: Treinamento de redes neurais com o TensorFlow

No capítulo final, você usará APIs de alto nível no TensorFlow 2 para treinar um classificador de letras da língua de sinais. Você usará o Keras APIsequencial e funcional para treinar, validar, fazer previsões e avaliar modelos. Você também aprenderá a usar o Estimators API para simplificar o processo de definição e treinamento de modelos e evitar erros.

Exercise 1: Definição de redes neurais com o Keras Exercise 2: O modelo sequencial no Keras Exercise 3: Compilação de um modelo sequencial Exercise 4: Definição de um modelo de múltiplas entradas Exercise 5: Treinamento e validação com o Keras Exercise 6: Treinamento com o Keras Exercise 7: Métricas e validação com o Keras Exercise 8: Detecção de sobreajuste Exercise 9: Avaliação de modelos Exercise 10: Modelos de treinamento com os Estimadores API Exercise 11: Preparando-se para treinar com os Estimadores Exercise 12: Definição de estimadores Exercise 13: Parabéns!