or
Questo esercizio fa parte del corso
In questo capitolo esplorerai che cos’è il feature engineering e come iniziare ad applicarlo a dati del mondo reale. Caricherai, esplorerai e visualizzerai un insieme di risposte a un sondaggio e, così facendo, scoprirai i relativi tipi di dato e perché influenzano il modo in cui dovresti progettare le tue feature. Con il pacchetto pandas creerai nuove feature sia da colonne categoriche sia da colonne continue.
Questo capitolo ti introduce alla realtà dei dati disordinati e incompleti. Imparerai a individuare dove mancano valori nei tuoi dati ed esplorerai diversi approcci per gestirli. Userai anche tecniche di manipolazione di stringhe per rimuovere o trattare caratteri indesiderati nel tuo insieme di dati.
In questo capitolo ti concentrerai sull’analisi della distribuzione sottostante dei tuoi dati e su come potrebbe influenzare la tua pipeline di Machine Learning. Imparerai a gestire dati asimmetrici e situazioni in cui i valori anomali possono avere un impatto negativo sulla tua analisi.
Infine, in questo capitolo lavorerai con dati testuali non strutturati, comprendendo come ricavare feature colonnari da un corpus di testo. Confronterai come approcci diversi possano influire sulla quantità di contesto estratta da un testo e come bilanciare l’esigenza di contesto senza generare troppe feature.
Esercizio attuale