Noktalama işaretlerini kaldırma

Artık geri bildirim metninden durak (stop) sözcükleri kaldırdığına göre, sıra noktalama işaretlerini ele almaya geldi. Bir önceki egzersizde elde ettiğin belirteçlerde hâlâ noktalama işaretleri var ve bunlar geri bildirimi kategorize ederken genellikle gereksizdir.

Görevin, verilen belirteç listesinden noktalama işaretlerini kaldırarak veriyi daha da temizlemek.

Bu egzersiz, kursun bir parçasıdır

Python ile Natural Language Processing (NLP)

Kursa Göz Atın

Egzersiz talimatları

Tüm noktalama işaretlerini kaldırarak filtered_tokens listesini temizle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python ile Natural Language Processing (NLP)

IntermediárioNível de habilidade

4.9+

729 reviews

Kursa Ücretsiz Başla

Natural Language Processing (NLP) içinde metin işlemenin temel gerekliliklerini öğren. Tokenization, durak (stop) sözcük ve noktalama işaretlerini kaldırma, ayrıca küçük harfe çevirme, stemming ve lemmatization ile metin normalleştirme tekniklerinde ustalaşarak metin verisini ileri analiz ve içgörü çıkarımı için hazırla.

Exercise 1: Doğal dil işlemenin temellerine giriş Exercise 2: Cümle ve kelime tokenizasyonu Exercise 3: NLP iş akışı Exercise 4: Stop words ve noktalama işaretlerini işleme Exercise 5: Durdurma sözcüklerini kaldırma Exercise 6: Noktalama işaretlerini kaldırma

Geçerli egzersiz

Exercise 7: Metin normalleştirme teknikleri Exercise 8: Küçük harfe çevirme Exercise 9: Stemming Exercise 10: Lemmatizasyon

Ham metni güçlü sayısal özelliklere dönüştür. Belgeler arasında sözcük önemini yakalamak için Bag-of-Words ve TF-IDF temsilleri oluştur, ardından Word2Vec ve GloVe gibi kelime gömme (embedding) yöntemleriyle derin anlamsal örüntüleri keşfet. Metnini canlandırmak için sıklık, önem ve benzerliği görselleştir.

Exercise 1: Bag-of-Words gösterimi Exercise 2: Müşteri incelemelerinden sözlük oluşturma Exercise 3: BoW ile metni sayılara dönüştürme Exercise 4: Ürün yorumlarının frekans analizi Exercise 5: Kelime frekanslarını görselleştirme Exercise 6: TF-IDF vektörleştirme Exercise 7: Ürün geri bildirimlerinin TF-IDF temsili Exercise 8: BoW ve TF-IDF gösterimlerini karşılaştırma Exercise 9: Gömlemeler Exercise 10: Gömme vektörlerle kelime ilişkilerini keşfetme Exercise 11: Kelime gömme vektörlerini görselleştirme ve karşılaştırma

Önceden eğitilmiş modellerin gücünden yararlanarak gelişmiş metin sınıflandırma görevlerini gerçekleştir. Duygu analizi, konu sınıflandırma ve doğal dil çıkarımı için Hugging Face pipeline’larını kullan. Hiçbir şeyi sıfırdan kurmana gerek kalmadan, en güncel modellerle anlamsal benzerliği ve dilbilgisel doğruluğu değerlendir.

Exercise 1: Duygu analizi için Hugging Face pipeline’ları Exercise 2: Bir değerlendirmenin duygu durumunu analiz etme Exercise 3: Birden çok yorumu toplu olarak sınıflandırma Exercise 4: Etiketli yorum verilerinde modelleri karşılaştırma Exercise 5: Sıfır-atış sınıflandırma ve QNLI Exercise 6: Destek taleplerinin zero-shot sınıflandırılması Exercise 7: Metin soruyu yanıtlıyor mu?Exercise 8: Soru benzerliği ve dilbilgisel doğruluk Exercise 9: Yinelenen soruları tespit et Exercise 10: Dilbilgisel doğruluğu kontrol etme

Modern NLP uygulamalarının özüne, token sınıflandırma ve metin üretimi teknikleriyle dal. NER ve PoS etiketleme ile anlamlı varlıkları ve dilbilgisel yapıları çıkarmayı öğren. Hem çıkarımsal hem de özetleyici soru yanıtlama yöntemlerinde ustalaş ve Hugging Face pipeline’larıyla özetleme, çeviri ve dil modelleme dahil gelişmiş üretim görevlerini keşfet.

Exercise 1: Token sınıflandırma Exercise 2: Haber başlıklarında adlandırılmış varlıkları belirleme Exercise 3: Metin analizi için Sözcük Türü (PoS) etiketleme Exercise 4: Soru yanıtlama Exercise 5: Ürün açıklamalarından soruları yanıtlama Exercise 6: Özetleyici QA ile doğal yanıtlar üretme Exercise 7: Dizi üretim görevleri Exercise 8: Hızlı içgörüler için haber makalelerini özetleme Exercise 9: Müşteri yorumlarını Fransızcaya çevirme Exercise 10: Arama tamamlama sistemi kurma Exercise 11: Tebrikler