Karşılaştırma Bulutu

Bu egzersizde, terim sıklığını anlaman için yaygın bir görselleştirme oluşturacaksın. Özellikle, pozitif ve negatif birleştirilmiş dokümanlar içindeki en sık geçen terimleri inceleyeceksin. Daha önce oluşturduğun TermDocumentMatrix all_tdm'i hatırla. 1000 kiralama yorumunun yerine bu matris, polarity() puanına göre ayrılmış tüm yorumları içeren 2 dokümandan oluşuyor.

Genellikle TDM'yi bir matrise çevirmek daha kolaydır. Oradan sütunları yeniden adlandırırsın. Aşağıda gösterildiği gibi, colnames() fonksiyonunun atama operatörünün sol tarafında çağrıldığını unutma.

colnames(OBJECT) <- c("COLUMN_NAME1", "COLUMN_NAME2")

Bunu yaptıktan sonra, en pozitif ve en negatif kelimeleri görmek için matrisi yeniden sıralayacaksın. Bu terimleri incele ki sonuç egzersizlerini yanıtlayabilesin!

Son olarak, terimleri comparison.cloud() kullanarak görselleştireceksin.

Bu egzersiz, kursun bir parçasıdır

R ile Duygu Analizi

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Matrix
___

# Column names
colnames(___) <- ___

# Top pos words
order_by_pos <- order(all_tdm_m[, ___], decreasing = ___)

# Review top 10 pos words
all_tdm_m[order_by_pos, ] %>% head(___)

# Top neg words
order_by_neg <- order(___, decreasing = ___)

# Review top 10 neg words
all_tdm_m[___, ] %>% ___

Kodu Düzenle ve Çalıştır