Kutu grafiği
Birden fazla dağılımı karşılaştırmanın kolay bir yolu kutu grafiğidir. Bu kod, birden çok kutu grafiği oluşturarak derli toplu bir görselleştirme yapmana yardımcı olacak.
Bu egzersizde all_book_polarity nesnesi zaten yüklü. Veri çerçevesi book ve polarity olmak üzere iki sütun içerir. Tüm kitaplarda qdap'ın polarity() fonksiyonu uygulanmıştır. Büyük nesnenin ilk 3 satırı burada.
| book | polarity | |
|---|---|---|
| 14 | huck | 0.2773501 |
| 22 | huck | 0.2581989 |
| 26 | huck | -0.5773503 |
Bu egzersiz, düzensiz (ragged) bir dizi üzerinde fonksiyonlar uygulamana olanak tanıyan tapply() fonksiyonunu tanıtıyor. Bir değer vektörü ve ardından bir faktör vektörü girersin. Her faktör-değer kombinasyonu için üçüncü parametre olan bir fonksiyon (örneğin min()) uygulanır. Örneğin iki vektör üzerinde tapply() kullanan bazı kodlar şöyle:
f1 <- as.factor(c("Group1", "Group2", "Group1", "Group2"))
stat1 <- c(1, 2, 1, 2)
tapply(stat1, f1, sum)
Sonuç, Group1 için 2 (1+1) ve Group2 için 4 (2+2) değerine sahip bir dizidir.
Bu egzersiz
R ile Duygu Analizi
kursunun bir parçasıdırEgzersiz talimatları
- Zaten yüklü olduğu için,
str()ileall_book_polaritynesnesini incele. tapply()kullanarakall_book_polarity$polarity,all_book_polarity$bookvesummary()fonksiyonunu geçir. Bu, 4 kitabınpolarity()puanlarına göre özet istatistiklerini yazdırır. Oz ve Huck Finn'in ortalamalarının Agamemnon veya Moby Dick'ten daha yüksek olmasını beklersin. Özellikle medyana dikkat et.all_book_polarity'yi veriye geçirerekggplot()ile bir kutu grafiği oluştur.- Estetikler
aes(x = book, y = polarity)olmalı. - Bir
+kullanarakcol = "darkred"ilegeom_boxplot()ekle. Her kutudaki ortancayı (median) temsil eden koyu çizgiye özellikle dikkat et. - Son olarak, her bir kelime için noktalar eklemek üzere
geom_jitter()adlı başka bir katman ekle.
- Estetikler
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Examine
___
# Summary by document
___
# Box plot
ggplot(___, aes(x = ___, y = ___)) +
___(fill = c("#bada55", "#F00B42", "#F001ED", "#BA6E15"), col = "___") +
___(position = position_jitter(width = 0.1, height = 0), alpha = 0.02) +
theme_gdocs() +
ggtitle("Book Polarity")