Filtro antispam bayesiano

Ottimo lavoro con l’esercizio precedente! Ora affrontiamo il famoso teorema di Bayes e usiamolo per un compito semplice ma importante: rilevare lo spam.

Mentre scorri la posta in arrivo, hai notato che molte delle email su cui preferiresti non perdere tempo contengono frasi esclamative, come "BUY NOW!!!". Ti viene quindi in mente che la presenza di tre punti esclamativi consecutivi possa essere un buon predittore di spam! Hai quindi preparato un DataFrame chiamato emails con due variabili: spam, che indica se l’email è spam, e contains_3_exlc, che indica se contiene la stringa "!!!". L’anteprima dei dati è la seguente:

     spam    contains_3_excl
0    False             False
1    False             False
2    True              False
3    False             False
4    False             False

Il tuo compito è calcolare la probabilità che l’email sia spam dato che contiene tre punti esclamativi. Procediamo passo dopo passo! Ecco la formula di Bayes come riferimento:

$$P(A|B) = \frac{P(B|A) * P(A)}{P(B)}$$

Questo esercizio fa parte del corso

Analisi dei dati bayesiana in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Calculate and print the unconditional probability of spam
p_spam = ____[____].____
print(____)

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Analisi dei dati bayesiana in Python

IntermediárioNível de habilidade

4.8+

Inizia il corso gratuitamente

Fai i primi passi nel mondo bayesiano. In questo capitolo ti presenteremo i concetti di base di probabilità e distribuzioni statistiche, oltre al famoso Teorema di Bayes, la pietra angolare dei metodi bayesiani. Infine, costruirai il tuo primo modello bayesiano per trarre conclusioni da lanci di moneta casuali.

Exercise 1: Chi è Bayes? Che cos'è Bayes?Exercise 2: Bayesiani vs. Frequentisti Exercise 3: Distribuzioni di probabilità Exercise 4: Probabilità e teorema di Bayes Exercise 5: Giochiamo a carte Exercise 6: Filtro antispam bayesiano

Esercizio attuale

Exercise 7: Cosa dice il test?Exercise 8: Assaporando Bayes Exercise 9: Lanciare una moneta Exercise 10: Più lanci, più impari Exercise 11: Ehi, questa moneta è equa?

È il momento di guardare sotto il cofano bayesiano. Imparerai ad applicare il Teorema di Bayes a dati sull’efficacia di farmaci per stimare i parametri di distribuzioni di probabilità usando la tecnica dell’approssimazione a griglia e ad aggiornare queste stime man mano che arrivano nuovi dati. Poi vedrai come incorporare conoscenze pregresse nel modello e, per finire, farai pratica con l’importante abilità di presentare i risultati a un pubblico non tecnico.

Exercise 1: Sotto il cofano bayesiano Exercise 2: Verso l’approssimazione a griglia Exercise 3: Approssimazione a griglia senza conoscenze pregresse Exercise 4: Aggiornare la credenza a posteriori Exercise 5: Convinzione a priori Exercise 6: La verità del prior Exercise 7: Scegliere la prior giusta Exercise 8: Simulare campioni a posteriori Exercise 9: Presentare i risultati bayesiani Exercise 10: Stime puntuali Exercise 11: Intervalli credibili di massima densità a posteriori Exercise 12: Il significato di credibilità

Metti in pratica le nuove competenze di analisi dei dati bayesiana per risolvere sfide reali di business. Lavorerai con dati di marketing per vendite online per condurre A/B test, analisi decisionale e previsione con modelli di regressione lineare.

Exercise 1: Test A/B Exercise 2: Simula la posteriore beta Exercise 3: Tassi di click posteriori Exercise 4: A o B, e quanto ne siamo sicuri?Exercise 5: Quanto può andar male?Exercise 6: Analisi decisionale Exercise 7: Analisi decisionale: costo Exercise 8: Analisi decisionale: profitto Exercise 9: Regressione e forecasting Exercise 10: Definire un modello di regressione bayesiana Exercise 11: Analisi dei parametri della regressione Exercise 12: Distribuzione predittiva

In questo capitolo finale sfrutterai la potenza del pacchetto PyMC3 per adattare con facilità modelli di regressione bayesiana, verificare la convergenza del modello, scegliere tra modelli concorrenti e generare previsioni per nuovi dati. Per concludere, applicherai quanto appreso per trovare il prezzo ottimale degli avocado in un caso di studio di analisi bayesiana. Buon lavoro!

Exercise 1: Markov Chain Monte Carlo e stima del modello Exercise 2: Markov Chain Monte Carlo Exercise 3: Campionare dal posterior Exercise 4: Interpretare i risultati e confrontare i modelli Exercise 5: Ispezionare i campioni posteriori Exercise 6: Confrontare i modelli con WAIC Exercise 7: Fare previsioni Exercise 8: Campiona dalla densità predittiva Exercise 9: Stima dell'errore sul test Exercise 10: Quanto costa un avocado?Exercise 11: Adattare il modello Exercise 12: Ispezionare il modello Exercise 13: Ottimizzare il prezzo Exercise 14: Considerazioni finali