Os perigos dos mínimos locais

Considere o gráfico da seguinte função de perda, loss_function(), que contém um mínimo global, marcado pelo ponto à direita, e vários mínimos locais, incluindo o marcado pelo ponto à esquerda.

O gráfico é de uma função de variável única que contém vários mínimos locais e um mínimo global.

Neste exercício, você tentará encontrar o mínimo global de loss_function() usando keras.optimizers.SGD(). Você fará isso duas vezes, cada vez com um valor inicial diferente da entrada para loss_function(). Primeiro, você usará x_1, que é uma variável com um valor inicial de 6,0. Em segundo lugar, você usará x_2, que é uma variável com um valor inicial de 0,3. Observe que o site loss_function() foi definido e está disponível.

Este exercício faz parte do curso

Introdução ao TensorFlow em Python

Instruções do exercício

Defina opt para usar o otimizador de descida de gradiente estocástico (SGD) com uma taxa de aprendizado de 0,01.
Faça a minimização usando a função de perda, loss_function(), e a variável com um valor inicial de 6,0, x_1.
Faça a minimização usando a função de perda, loss_function(), e a variável com um valor inicial de 0,3, x_2.
Imprima x_1 e x_2 como matrizes numpy e verifique se os valores são diferentes. Esses são os mínimos que o algoritmo identificou.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize x_1 and x_2
x_1 = Variable(6.0,float32)
x_2 = Variable(0.3,float32)

# Define the optimization operation
opt = keras.optimizers.____(learning_rate=____)

for j in range(100):
	# Perform minimization using the loss function and x_1
	opt.minimize(lambda: loss_function(____), var_list=[____])
	# Perform minimization using the loss function and x_2
	opt.minimize(lambda: ____, var_list=[____])

# Print x_1 and x_2 as numpy arrays
print(____.numpy(), ____.numpy())

Editar e executar o código

Este exercício faz parte do curso

Introdução ao TensorFlow em Python

IntermediárioNível de habilidade

4.8+

Iniciar curso de graça

Antes de criar modelos avançados no TensorFlow 2, você precisa primeiro entender os conceitos básicos. Neste capítulo, você aprenderá a definir constantes e variáveis, realizar adição e multiplicação de tensores e calcular derivadas. Conhecimento de álgebra linear será útil, mas não necessário.

Exercise 1: Constantes e variáveis Exercise 2: Definição de dados como constantes Exercise 3: Definição de variáveis Exercise 4: Operações básicas Exercise 5: Realização de multiplicação por elementos Exercise 6: Fazer previsões com a multiplicação de matrizes Exercise 7: Somando as dimensões do tensor Exercise 8: Operações avançadas Exercise 9: Reformulação de tensores Exercise 10: Otimização com gradientes Exercise 11: Trabalho com dados de imagem

Neste capítulo, você aprenderá a criar, resolver e fazer previsões com modelos no TensorFlow 2. Você se concentrará em uma classe simples de modelos - o modelo de regressão linear - e tentará prever os preços das moradias. Ao final do capítulo, você saberá como carregar e manipular dados, construir funções de perda, realizar minimização, fazer previsões e reduzir o uso de recursos com treinamento em lote.

Exercise 1: Dados de entrada Exercise 2: Carregar dados usando pandas Exercise 3: Definir o tipo de dados Exercise 4: Funções de perda Exercise 5: Funções de perda no TensorFlow Exercise 6: Modificação da função de perda Exercise 7: Regressão linear Exercise 8: Configure uma regressão linear Exercise 9: Treinar um modelo linear Exercise 10: Regressão linear múltipla Exercise 11: Treinamento em lote Exercise 12: Preparando-se para o treinamento em lote Exercise 13: Treinamento de um modelo linear em lotes

Os capítulos anteriores ensinaram a você como criar modelos no TensorFlow 2. Neste capítulo, você aplicará essas mesmas ferramentas para criar, treinar e fazer previsões com redes neurais. Você aprenderá a definir camadas densas, aplicar funções de ativação, selecionar um otimizador e aplicar regularização para reduzir o excesso de ajuste. Você aproveitará a flexibilidade do TensorFlow usando álgebra linear de baixo nível e operações de alto nível do Keras API para definir e treinar modelos.

Exercise 1: Camadas densas Exercise 2: A álgebra linear de camadas densas Exercise 3: A abordagem de baixo nível com vários exemplos Exercise 4: Usando a operação de camada densa Exercise 5: Funções de ativação Exercise 6: Problemas de classificação binária Exercise 7: Problemas de classificação multiclasse Exercise 8: Otimizadores Exercise 9: Os perigos dos mínimos locais

Exercício atual

Exercise 10: Evitar mínimos locais Exercise 11: Treinamento de uma rede no TensorFlow Exercise 12: Inicialização no TensorFlow Exercise 13: Definição do modelo e da função de perda Exercise 14: Treinamento de redes neurais com o TensorFlow

No capítulo final, você usará APIs de alto nível no TensorFlow 2 para treinar um classificador de letras da língua de sinais. Você usará o Keras APIsequencial e funcional para treinar, validar, fazer previsões e avaliar modelos. Você também aprenderá a usar o Estimators API para simplificar o processo de definição e treinamento de modelos e evitar erros.

Exercise 1: Definição de redes neurais com o Keras Exercise 2: O modelo sequencial no Keras Exercise 3: Compilação de um modelo sequencial Exercise 4: Definição de um modelo de múltiplas entradas Exercise 5: Treinamento e validação com o Keras Exercise 6: Treinamento com o Keras Exercise 7: Métricas e validação com o Keras Exercise 8: Detecção de sobreajuste Exercise 9: Avaliação de modelos Exercise 10: Modelos de treinamento com os Estimadores API Exercise 11: Preparando-se para treinar com os Estimadores Exercise 12: Definição de estimadores Exercise 13: Parabéns!