or
Latihan ini merupakan bagian dari kursus
Bab 1 dari Pengantar Natural Langauge Processing mempersiapkan Anda untuk menjalankan analisis teks pertama Anda. Anda akan mempelajari regular expression dan tokenisasi, dua komponen paling umum dalam sebagian besar tugas analisis. Dengan regular expression, Anda dapat mencari pola apa pun yang Anda bayangkan, dan dengan tokenisasi, Anda dapat menyiapkan dan membersihkan teks untuk analisis yang lebih canggih. Bab ini penting untuk menerapkan teknik-teknik yang akan kita pelajari di bab-bab berikutnya dalam kursus ini.
Di bab ini, Anda akan mempelajari cara-cara paling umum dan banyak diteliti untuk menganalisis teks. Anda akan melihat pembuatan korpus teks, memperluas representasi bag-of-words menjadi matriks TFIDF, dan menggunakan metrik cosine similarity untuk menentukan seberapa mirip dua potongan teks satu sama lain. Anda membangun fondasi untuk mempraktikkan NLP sebelum masuk ke penerapan NLP pada bab 3 dan 4.
Latihan Saat Ini
Bab 3 berfokus pada dua pendekatan analisis teks yang umum, pemodelan klasifikasi dan topic modeling. Jika Anda mengerjakan proyek analisis teks, Anda hampir pasti akan menggunakan salah satu atau kedua metode ini. Bab ini mengajarkan cara melakukan kedua teknik tersebut dan memberi wawasan tentang bagaimana mendekati teknik-teknik ini dari sudut pandang praktis.
Pada bab 4 kita membahas dua teknik utama dalam natural language processing, analisis sentimen dan word embedding. Keduanya merupakan teknik analisis yang wajib dipahami bagi siapa pun yang mempelajari dasar-dasar analisis teks. Selain itu, Anda akan mempelajari secara singkat tentang BERT, part-of-speech tagging, dan named entity recognition. Hampir 15 teknik analisis berbeda dibahas dalam kursus ini, sehingga bab 4 ditutup dengan merangkum semua teknik hebat yang akan Anda pelajari dalam kursus ini.