qdap ile temizleme
qdap paketi başka metin temizleme fonksiyonları da sunar. Her biri kendi başına faydalıdır ve özellikle diğerleriyle birleştirildiğinde çok güçlüdür.
bracketX(): Parantez içindeki tüm metni kaldırır (ör. "It's (so) cool" → "It's cool")replace_number(): Sayıları sözcük karşılıklarıyla değiştirir (ör. "2" → "two")replace_abbreviation(): Kısaltmaları tam metin karşılıklarıyla değiştirir (ör. "Sr" → "Senior")replace_contraction(): Kısaltmalı biçimleri temel sözcüklere geri çevirir (ör. "shouldn't" → "should not")replace_symbol(): Yaygın sembolleri sözcük karşılıklarıyla değiştirir (ör. "$" → "dollar")
Bu egzersiz
R ile Bag-of-Words ile Metin Madenciliği
kursunun bir parçasıdırEgzersiz talimatları
Önceki egzersizdeki text nesnesine aşağıdaki fonksiyonları uygula:
bracketX()replace_number()replace_abbreviation()replace_contraction()replace_symbol()
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
## text is still loaded in your workspace
# Remove text within brackets
___
# Replace numbers with words
___
# Replace abbreviations
___
# Replace contractions
___
# Replace symbols with words
___