or
Questo esercizio fa parte del corso
Inizieremo il corso chiarendo cos'è la data science. Esploreremo il suo flusso di lavoro e come può essere applicata a problemi reali. Concluderemo il capitolo imparando a conoscere i principali ruoli professionali all'interno di questo settore.
Ora che abbiamo compreso il flusso di lavoro della data science, approfondiamo la prima fase: la raccolta e l'archiviazione dei dati. Scopriremo quali sono le diverse fonti di dati a cui puoi attingere, come si presentano i dati, come archiviarli una volta raccolti e come una pipeline di dati può automatizzare il processo.
La preparazione dei dati è fondamentale: i data scientist dedicano l'80% del loro tempo alla pulizia e alla manipolazione dei dati e solo il 20% del loro tempo all'analisi effettiva. Questo capitolo ti mostrerà come diagnosticare i problemi nei tuoi dati, come gestire i valori mancanti e gli outlier o valori anomali. Imparerai poi a conoscere la visualizzazione, un altro strumento essenziale per esplorare i tuoi dati e comunicare i tuoi risultati.
In questo capitolo finale, parleremo di sperimentazione e previsione! Iniziando con gli esperimenti, parleremo dei test A/B e passeremo alla previsione di serie temporali, dove impareremo a prevedere eventi futuri. Infine, concluderemo con il machine learning, esaminando l'apprendimento supervisionato e il clustering.
Esercizio in corso