or
Bu egzersiz, kursun bir parçasıdır
Doğal Dil İşlemeye Giriş'in 1. bölümü, metin üzerinde ilk analizini çalıştırmaya hazırlıyor. En yaygın analiz görevlerinin iki bileşeni olan düzenli ifadeler ve tokenleştirmeyi keşfedeceksin. Düzenli ifadelerle aklına gelebilecek herhangi bir deseni arayabilir, tokenleştirme ile metni daha gelişmiş analizlere hazırlayıp temizleyebilirsin. Bu bölüm, kursun geri kalanındaki tekniklerin üstesinden gelmek için gereklidir.
Bu bölümde, metni analiz etmenin en yaygın ve en çok incelenen yollarını öğreneceksin. Bir metin korpusu oluşturmayı, bir bag-of-words temsilini TFIDF matrisine genişletmeyi ve iki metin parçasının birbirine ne kadar benzer olduğunu belirlemek için cosine-similarity ölçütlerini kullanmayı göreceksin. 3. ve 4. bölümlerde NLP uygulamalarına dalmadan önce, NLP pratiği için temellerini güçlendireceksin.
Geçerli egzersiz
3. bölüm, iki yaygın metin analizi yaklaşımına odaklanır: sınıflandırma modelleme ve konu modelleme. Metin analizi projelerinde çalışıyorsan, er ya da geç bu yöntemlerden birini ya da her ikisini kullanacaksın. Bu bölüm, her iki tekniği nasıl uygulayacağını öğretir ve bu tekniklere pratik açıdan nasıl yaklaşacağına dair içgörüler sunar.
4. bölümde doğal dil işlemenin iki temelini ele alıyoruz: duygu analizi ve kelime gömmeleri. Bunlar, metin analizi temellerini öğrenen herkes için olmazsa olmaz iki analiz tekniğidir. Ayrıca kısaca BERT, sözcük türü etiketleme (part-of-speech tagging) ve adlandırılmış varlık tanımayı da öğreneceksin. Bu kursta neredeyse 15 farklı analiz tekniği ele alındı; bu yüzden 4. bölüm, bu kursta öğreneceğin tüm harika teknikleri özetleyerek sona eriyor.