Karşılaştırma Bulutu
Bu egzersizde, terim sıklığını anlaman için yaygın bir görselleştirme oluşturacaksın. Özellikle, pozitif ve negatif birleştirilmiş dokümanlar içindeki en sık geçen terimleri inceleyeceksin. Daha önce oluşturduğun TermDocumentMatrix all_tdm'i hatırla. 1000 kiralama yorumunun yerine bu matris, polarity() puanına göre ayrılmış tüm yorumları içeren 2 dokümandan oluşuyor.
Genellikle TDM'yi bir matrise çevirmek daha kolaydır. Oradan sütunları yeniden adlandırırsın. Aşağıda gösterildiği gibi, colnames() fonksiyonunun atama operatörünün sol tarafında çağrıldığını unutma.
colnames(OBJECT) <- c("COLUMN_NAME1", "COLUMN_NAME2")
Bunu yaptıktan sonra, en pozitif ve en negatif kelimeleri görmek için matrisi yeniden sıralayacaksın. Bu terimleri incele ki sonuç egzersizlerini yanıtlayabilesin!
Son olarak, terimleri comparison.cloud() kullanarak görselleştireceksin.
Bu egzersiz
R ile Duygu Analizi
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Matrix
___
# Column names
colnames(___) <- ___
# Top pos words
order_by_pos <- order(all_tdm_m[, ___], decreasing = ___)
# Review top 10 pos words
all_tdm_m[order_by_pos, ] %>% head(___)
# Top neg words
order_by_neg <- order(___, decreasing = ___)
# Review top 10 neg words
all_tdm_m[___, ] %>% ___