or
Questo esercizio fa parte del corso
Il Capitolo 1 di Introduzione all'Elaborazione del Linguaggio Naturale ti prepara a eseguire la tua prima analisi su testi. Esplorerai le espressioni regolari e la tokenizzazione, due componenti tra le più comuni nella maggior parte dei compiti di analisi. Con le espressioni regolari puoi cercare qualunque schema ti venga in mente e, con la tokenizzazione, puoi preparare e ripulire il testo per analisi più sofisticate. Questo capitolo è necessario per affrontare le tecniche che imparerai nei restanti capitoli del corso.
In questo capitolo imparerai i modi più diffusi e studiati per analizzare il testo. Vedrai come creare un corpus testuale, trasformare una rappresentazione bag-of-words in una matrice TFIDF e usare metriche di similarità coseno per determinare quanto due testi siano simili tra loro. Consoliderai le basi per praticare l’NLP prima di passare alle applicazioni dell’NLP nei capitoli 3 e 4.
Esercizio attuale
Il Capitolo 3 si concentra su due approcci comuni all’analisi del testo: la modellazione di classificazione e il topic modeling. Se lavori su progetti di analisi testuale, prima o poi userai uno o entrambi questi metodi. Questo capitolo ti insegna a eseguire entrambe le tecniche e offre indicazioni su come affrontarle da un punto di vista pratico.
Nel Capitolo 4 trattiamo due pilastri dell’elaborazione del linguaggio naturale: sentiment analysis e word embeddings. Sono due tecniche di analisi imprescindibili per chi studia le basi dell’analisi del testo. Inoltre, imparerai brevemente a conoscere BERT, il part-of-speech tagging e il named entity recognition. In questo corso sono state coperte quasi 15 tecniche di analisi diverse, quindi il Capitolo 4 si chiude ricapitolando tutte le ottime tecniche che imparerai in questo percorso.