IniziaInizia gratis

Che cos'è la regressione logistica?

Il modello che userai in questo capitolo si chiama regressione logistica. È molto simile a una regressione lineare, ma invece di prevedere una variabile numerica, stima la probabilità (tra 0 e 1) di un evento.

Per usarla come algoritmo di classificazione, ti basta impostare una soglia su queste probabilità. Se la probabilità prevista è sopra la soglia, classifichi quell'osservazione come "sì" (in questo caso, volo in ritardo); se è sotto, la classifichi come "no"!

Effettuerai il tuning di questo modello provando diversi valori per alcuni iperparametri. Un iperparametro è un valore del modello che non viene stimato dai dati, ma viene fornito dall'utente per massimizzare le prestazioni. In questo corso non è necessario capire la matematica dietro tutti questi valori: l'importante è provare alcune opzioni diverse e scegliere la migliore.

Perché fornisci tu gli iperparametri?

Questo esercizio fa parte del corso

Fondamenti di PySpark

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio