Ürün geri bildirimlerinin TF-IDF temsili

Akıllı ev şirketinde müşteri destek ekibiyle çalışıyorsun. Çeşitli akıllı cihazlarla ilgili kullanıcı geri bildirimleri topladılar ve her değerlendirmede hangi kelimelerin öne çıktığını bulmak istiyorlar. Geri bildirimler arasında en alakalı terimleri vurgulamak için TF-IDF tekniğini kullanmayı öneriyorsun. Haydi başlayalım!

Bir metni alıp işlenmiş halini döndüren preprocess() fonksiyonu senin için yüklendi. Bu fonksiyon küçük harfe çevirme, tokenizasyon ve noktalama işaretlerini kaldırma işlemlerini uygular. Pandas pd olarak içe aktarıldı ve TfidfVectorizer sınıfı kullanıma hazır.

Bu egzersiz, kursun bir parçasıdır

Python ile Natural Language Processing (NLP)

Kursa Göz Atın

Egzersiz talimatları

Bir TF-IDF vectorizer başlat.
Temizlenmiş değerlendirmeleri tfidf_matrix haline dönüştür.
Sütunları sözcük dağarcığındaki kelimeler olacak şekilde tfidf_matrix için df adlı bir DataFrame oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

reviews = ["The smart speaker is incredible. Clear sound and fast responses!",
           "I am disappointed with the smart bulb. It stopped working in a week.",
           "The thermostat is okay. Not too smart, but functional."]
cleaned_reviews = [preprocess(review) for review in reviews]

# Initialize the vectorizer
vectorizer = ____
# Transform the cleaned reviews
tfidf_matrix = ____
# Create a DataFrame for TF-IDF
df = pd.DataFrame(
  tfidf_matrix.toarray(),
  columns=vectorizer.____
)
print(df.head())

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python ile Natural Language Processing (NLP)

IntermediárioNível de habilidade

4.9+

Kursa Ücretsiz Başla

Natural Language Processing (NLP) içinde metin işlemenin temel gerekliliklerini öğren. Tokenization, durak (stop) sözcük ve noktalama işaretlerini kaldırma, ayrıca küçük harfe çevirme, stemming ve lemmatization ile metin normalleştirme tekniklerinde ustalaşarak metin verisini ileri analiz ve içgörü çıkarımı için hazırla.

Exercise 1: Doğal dil işlemenin temellerine giriş Exercise 2: Cümle ve kelime tokenizasyonu Exercise 3: NLP iş akışı Exercise 4: Stop words ve noktalama işaretlerini işleme Exercise 5: Durdurma sözcüklerini kaldırma Exercise 6: Noktalama işaretlerini kaldırma Exercise 7: Metin normalleştirme teknikleri Exercise 8: Küçük harfe çevirme Exercise 9: Stemming Exercise 10: Lemmatizasyon

Ham metni güçlü sayısal özelliklere dönüştür. Belgeler arasında sözcük önemini yakalamak için Bag-of-Words ve TF-IDF temsilleri oluştur, ardından Word2Vec ve GloVe gibi kelime gömme (embedding) yöntemleriyle derin anlamsal örüntüleri keşfet. Metnini canlandırmak için sıklık, önem ve benzerliği görselleştir.

Exercise 1: Bag-of-Words gösterimi Exercise 2: Müşteri incelemelerinden sözlük oluşturma Exercise 3: BoW ile metni sayılara dönüştürme Exercise 4: Ürün yorumlarının frekans analizi Exercise 5: Kelime frekanslarını görselleştirme Exercise 6: TF-IDF vektörleştirme Exercise 7: Ürün geri bildirimlerinin TF-IDF temsili

Geçerli egzersiz

Exercise 8: BoW ve TF-IDF gösterimlerini karşılaştırma Exercise 9: Gömlemeler Exercise 10: Gömme vektörlerle kelime ilişkilerini keşfetme Exercise 11: Kelime gömme vektörlerini görselleştirme ve karşılaştırma

Önceden eğitilmiş modellerin gücünden yararlanarak gelişmiş metin sınıflandırma görevlerini gerçekleştir. Duygu analizi, konu sınıflandırma ve doğal dil çıkarımı için Hugging Face pipeline’larını kullan. Hiçbir şeyi sıfırdan kurmana gerek kalmadan, en güncel modellerle anlamsal benzerliği ve dilbilgisel doğruluğu değerlendir.

Exercise 1: Duygu analizi için Hugging Face pipeline’ları Exercise 2: Bir değerlendirmenin duygu durumunu analiz etme Exercise 3: Birden çok yorumu toplu olarak sınıflandırma Exercise 4: Etiketli yorum verilerinde modelleri karşılaştırma Exercise 5: Sıfır-atış sınıflandırma ve QNLI Exercise 6: Destek taleplerinin zero-shot sınıflandırılması Exercise 7: Metin soruyu yanıtlıyor mu?Exercise 8: Soru benzerliği ve dilbilgisel doğruluk Exercise 9: Yinelenen soruları tespit et Exercise 10: Dilbilgisel doğruluğu kontrol etme

Modern NLP uygulamalarının özüne, token sınıflandırma ve metin üretimi teknikleriyle dal. NER ve PoS etiketleme ile anlamlı varlıkları ve dilbilgisel yapıları çıkarmayı öğren. Hem çıkarımsal hem de özetleyici soru yanıtlama yöntemlerinde ustalaş ve Hugging Face pipeline’larıyla özetleme, çeviri ve dil modelleme dahil gelişmiş üretim görevlerini keşfet.

Exercise 1: Token sınıflandırma Exercise 2: Haber başlıklarında adlandırılmış varlıkları belirleme Exercise 3: Metin analizi için Sözcük Türü (PoS) etiketleme Exercise 4: Soru yanıtlama Exercise 5: Ürün açıklamalarından soruları yanıtlama Exercise 6: Özetleyici QA ile doğal yanıtlar üretme Exercise 7: Dizi üretim görevleri Exercise 8: Hızlı içgörüler için haber makalelerini özetleme Exercise 9: Müşteri yorumlarını Fransızcaya çevirme Exercise 10: Arama tamamlama sistemi kurma Exercise 11: Tebrikler