Estimando o erro de teste

Agora que você tem o posterior_predictive (disponível no seu ambiente de trabalho), pode avaliar o desempenho do modelo em novos dados. Para isso, você vai precisar iterar sobre as observações de teste e, para cada uma delas, calcular o erro de previsão como a diferença entre a distribuição preditiva para essa observação e o valor real. Isso vai gerar a distribuição do erro do seu modelo, que você poderá visualizar.

Você vai precisar de pymc3 e numpy, que já foram importados como pm e np, respectivamente. Os dados de teste, bikes_test, também estão disponíveis no seu ambiente. Vamos lá!

Este exercicio faz parte do curso

Análise de Dados Bayesiana em Python

Instruções do exercicio

Inicialize errors como uma lista vazia.
Para cada linha em bikes_test, calcule o erro de previsão como as amostras preditivas para essa linha a partir de posterior_predictive menos o único valor real de num_bikes da linha.
Redimensione errors convertendo-os para um array do numpy e aplicando o método .reshape() ao resultado, e atribua o resultado final a error_distribution.
Plote a distribuição do erro de teste usando a função plot_posterior() do pymc3.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Initialize errors
errors = ____

# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
    error = ____[____][:, ____] - ____[____]
    errors.append(error)

# Reshape errors
error_distribution = ____(____).____()

# Plot the error distribution
____
plt.show()

Editar e Executar Código

Este exercicio faz parte do curso

Análise de Dados Bayesiana em Python

IntermediárioNível de habilidade

4.8+

Comece o curso gratuitamente

Dê seus primeiros passos no mundo bayesiano. Neste capítulo, você será apresentado aos conceitos básicos de probabilidade e distribuições estatísticas, além do famoso Teorema de Bayes, a pedra angular dos métodos bayesianos. Para concluir, você vai construir seu primeiro modelo bayesiano para tirar conclusões a partir de lançamentos de moeda aleatórios.

Exercise 1: Quem é Bayes? O que é Bayes?Exercise 2: Bayesianos vs. Frequentistas Exercise 3: Distribuições de probabilidade Exercise 4: Probabilidade e Teorema de Bayes Exercise 5: Vamos jogar cartas Exercise 6: Filtro de spam Bayesiano Exercise 7: O que o teste diz?Exercise 8: Experimentando o Bayes Exercise 9: Lançando uma moeda Exercise 10: Quanto mais você lança, mais você aprende Exercise 11: Ei, essa moeda é justa?

É hora de olhar sob o capô bayesiano. Você vai aprender a aplicar o Teorema de Bayes a dados de efetividade de medicamentos para estimar os parâmetros de distribuições de probabilidade usando a técnica de aproximação por grade, e a atualizar essas estimativas conforme novos dados estiverem disponíveis. Em seguida, você verá como incorporar conhecimento prévio ao modelo e, por fim, vai praticar a importante habilidade de reportar resultados para um público não técnico.

Exercise 1: Sob o capô bayesiano Exercise 2: Rumo à aproximação por grade Exercise 3: Aproximação em grade sem conhecimento prévio Exercise 4: Atualizando a crença a posteriori Exercise 5: Crença prévia Exercise 6: A verdade do prior Exercise 7: Escolhendo o prior certo Exercise 8: Simulando amostras da posterior Exercise 9: Apresentando resultados bayesianos Exercise 10: Estimativas pontuais Exercise 11: Intervalos credíveis de Maior Densidade a Posteriori Exercise 12: O significado de credibilidade

Aplique suas novas habilidades de análise de dados bayesiana para resolver desafios reais de negócios. Você vai trabalhar com dados de marketing de vendas online para realizar testes A/B, análise de decisões e previsão com modelos de regressão linear.

Exercise 1: Teste A/B Exercise 2: Simular posterior beta Exercise 3: Taxas de clique posteriores Exercise 4: A ou B, e quão certo estamos?Exercise 5: Quão ruim pode ser?Exercise 6: Análise de decisão Exercise 7: Análise de decisão: custo Exercise 8: Análise de decisão: lucro Exercise 9: Regressão e previsão Exercise 10: Definindo um modelo de regressão bayesiano Exercise 11: Analisando parâmetros da regressão Exercise 12: Distribuição preditiva

Neste capítulo final, você vai aproveitar o poderoso pacote PyMC3 para ajustar com facilidade modelos de regressão bayesianos, realizar verificações de sanidade na convergência do modelo, escolher entre modelos concorrentes e gerar previsões para novos dados. Para fechar, você vai aplicar o que aprendeu para encontrar o preço ideal de avocados em um estudo de caso de análise de dados bayesiana. Boa sorte!

Exercise 1: Markov Chain Monte Carlo e ajuste de modelo Exercise 2: Markov Chain Monte Carlo Exercise 3: Amostrando draws do posterior Exercise 4: Interpretando resultados e comparando modelos Exercise 5: Inspecionando amostras a posteriori Exercise 6: Comparando modelos com WAIC Exercise 7: Fazendo previsões Exercise 8: Amostra da densidade preditiva Exercise 9: Estimando o erro de teste

Exercicio Atual

Exercise 10: Quanto custa um abacate?Exercise 11: Ajustando o modelo Exercise 12: Inspecionando o modelo Exercise 13: Otimizando o preço Exercise 14: Considerações finais