Tüyolar: basit kelime kümeleri
Bir sonraki bölümde, aşağıdaki gibi çeşitli (ama çok önemli) metin madenciliği konularını ele alacağız:
- TDM/DTM ağırlıklandırma
- TDM/DTM seyrekliğiyle başa çıkma
- Üstveriyi yakalama
- Konular için basit kelime kümeleri
- Birden fazla kelime üzerinde analiz
Şimdilik, coffee_tweets verimizden bir dendrogram adı verilen yeni bir görsel oluşturalım. Ayrıntılarını bir sonraki bölümde açıklayacağız.
Bu egzersiz, kursun bir parçasıdır
R ile Bag-of-Words ile Metin Madenciliği
Egzersiz talimatları
Kahve tweet'lerinden senin için hiyerarşik bir küme nesnesi hc oluşturuldu.
hc üzerinde plot() kullanarak bir dendrogram oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Plot a dendrogram
___