Doğal Dil İşlemeye Giriş'in 1. bölümü, metin üzerinde ilk analizini çalıştırmaya hazırlıyor. En yaygın analiz görevlerinin iki bileşeni olan düzenli ifadeler ve tokenleştirmeyi keşfedeceksin. Düzenli ifadelerle aklına gelebilecek herhangi bir deseni arayabilir, tokenleştirme ile metni daha gelişmiş analizlere hazırlayıp temizleyebilirsin. Bu bölüm, kursun geri kalanındaki tekniklerin üstesinden gelmek için gereklidir.

Düzenli ifadelerin temelleri

grep ile sözdizimi pratiği

Düzenli ifade fonksiyonlarını keşfetme.

Tokenizasyon

tidytext fonksiyonları

Tokenizasyon: cümleler

Metin temizliğinin temelleri

Metin önişleme: durak sözcükleri kaldır

Metin ön işleme: Kök bulma (Stemming)

Gerçek Temeller

Bu bölümde, metni analiz etmenin en yaygın ve en çok incelenen yollarını öğreneceksin. Bir metin korpusu oluşturmayı, bir bag-of-words temsilini TFIDF matrisine genişletmeyi ve iki metin parçasının birbirine ne kadar benzer olduğunu belirlemek için cosine-similarity ölçütlerini kullanmayı göreceksin.  3. ve 4. bölümlerde NLP uygulamalarına dalmadan önce, NLP pratiği için temellerini güçlendireceksin. 

Bir R derlemesini (corpus) anlamak

Bir R derlemini keşfet

Bir derlemden tibble oluşturma

Bir corpus oluşturma

Bag-of-words gösterimi

BoW Uygulaması

BoW Örneği

Seyrek matrisler

TFIDF

Manuel hesaplamalar

TFIDF Alıştırması

Kosinüs Benzerliği

Metin analizinde başarısız olmanın bir örneği

Kosinüs benzerliği örneği

Metnin Temsilleri

3. bölüm, iki yaygın metin analizi yaklaşımına odaklanır: sınıflandırma modelleme ve konu modelleme. Metin analizi projelerinde çalışıyorsan, er ya da geç bu yöntemlerden birini ya da her ikisini kullanacaksın. Bu bölüm, her iki tekniği nasıl uygulayacağını öğretir ve bu tekniklere pratik açıdan nasıl yaklaşacağına dair içgörüler sunar.

Modelleme için metni hazırlama

Veri hazırlama

Seyrek terimleri kaldırma

Sınıflandırma modelleme

Sınıflandırma modelleme örneği

Karışıklık matrisleri

TFIDF tibble vs dtm

Konu modellemeye giriş

LDA alıştırması

Konuları belgelere atama

Pratikte LDA

Perpleksiteyi test etme

LDA sonuçlarını gözden geçirme

Uygulamalar: Sınıflandırma ve Konu Modelleme

4. bölümde doğal dil işlemenin iki temelini ele alıyoruz: duygu analizi ve kelime gömmeleri. Bunlar, metin analizi temellerini öğrenen herkes için olmazsa olmaz iki analiz tekniğidir. Ayrıca kısaca BERT, sözcük türü etiketleme (part-of-speech tagging) ve adlandırılmış varlık tanımayı da öğreneceksin. Bu kursta neredeyse 15 farklı analiz tekniği ele alındı; bu yüzden 4. bölüm, bu kursta öğreneceğin tüm harika teknikleri özetleyerek sona eriyor. 

Duygu analizi

tidytext sözlükleri

Duygu puanları

Duygu ve his analizi

Kelime gömme (word embeddings)

h2o uygulaması

word2vec

Ek NLP analizleri

Yöntemleri gözden geçirme #1

Yöntemleri gözden geçir #2

Sonuç

İleri Teknikler

Animal Farm

Russian Troll tweets

Temel bir kurs olarak R ile Doğal Dil İşlemeye Giriş, metin analizi serüvenine başlamak için gereken araçları sana kazandırmak üzere tasarlandı. Natural Language Processing (NLP), son on yılda çok heyecan verici gelişmeler yaşayan ve sürekli büyüyen bir veri bilimi alanıdır. Bu kursta bu konuların temellerini ele alacak ve analiz yeteneklerini genişletmeye hazırlanacaksın. Düzenli ifadeler, konu modelleme, adlandırılmış varlık tanıma ve diğerlerine dalıyoruz; üstelik gelecekteki analizlerine hızlı bir başlangıç yapabileceğin kapsamlı örneklerle.

Intermediate R

Introduction to the Tidyverse

R'de doğal dil işleme için temel becerileri ve araçları keşfedin: regex, konu modelleme, varlık tanıma.

R ile Doğal Dil İşlemeye Giriş

R'de Doğal Dil İşleme alanında başarılı olmak için gerekli tüm beceri ve araçlara genel bir bakış edinin.

TFIDF

Create Your Free Account