or
Questo esercizio fa parte del corso
Spark è un framework per lavorare con i Big Data. In questo capitolo vedrai alcune nozioni di base su Spark e sul Machine Learning. Poi scoprirai come connetterti a Spark con Python e caricare dati CSV.
Ora che sai come importare i dati in Spark, passerai alla costruzione di due tipi di modelli di classificazione: Alberi decisionali e Regressione logistica. Scoprirai anche alcuni approcci alla preparazione dei dati.
Successivamente imparerai a creare modelli di Regressione lineare. Inoltre vedrai come arricchire i dati progettando nuovi predittori e un approccio solido per selezionare solo i predittori più rilevanti.
Infine imparerai a rendere i tuoi modelli più efficienti. Scoprirai come usare le pipeline per rendere il codice più chiaro e facile da mantenere. Poi userai la convalida incrociata per testare meglio i modelli e scegliere buoni iperparametri. Infine sperimenterai due tipi di modelli ensemble.
Esercizio attuale