Box plot
Cara mudah untuk membandingkan banyak distribusi adalah dengan box plot. Kode ini akan membantu Anda membuat beberapa box plot untuk menghasilkan visual yang ringkas.
Dalam latihan ini objek all_book_polarity sudah dimuat. Data frame ini berisi dua kolom, book dan polarity. Objek ini mencakup semua buku dengan fungsi polarity() dari qdap yang diterapkan. Berikut 3 baris pertama dari objek besar tersebut.
| book | polarity | |
|---|---|---|
| 14 | huck | 0.2773501 |
| 22 | huck | 0.2581989 |
| 26 | huck | -0.5773503 |
Latihan ini memperkenalkan tapply() yang memungkinkan Anda menerapkan fungsi pada array tak beraturan. Anda memasukkan sebuah vektor nilai lalu sebuah vektor faktor. Untuk setiap kombinasi faktor dan nilai, parameter ketiga, yaitu sebuah fungsi seperti min(), akan diterapkan. Sebagai contoh, berikut kode dengan tapply() yang digunakan pada dua vektor.
f1 <- as.factor(c("Group1", "Group2", "Group1", "Group2"))
stat1 <- c(1, 2, 1, 2)
tapply(stat1, f1, sum)
Hasilnya adalah sebuah array di mana Group1 memiliki nilai 2 (1+1) dan Group2 memiliki nilai 4 (2+2).
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Petunjuk latihan
- Karena sudah dimuat, periksa
all_book_polaritydenganstr(). - Dengan menggunakan
tapply(), masukkanall_book_polarity$polarity,all_book_polarity$book, dan fungsisummary(). Ini akan menampilkan statistik ringkas untuk keempat buku berdasarkan skorpolarity()-nya. Anda akan mendapati Oz dan Huck Finn memiliki rata-rata lebih tinggi daripada Agamemnon atau Moby Dick. Perhatikan dengan saksama median. - Buat box plot dengan
ggplot()dengan memasukkanall_book_polarity.- Estetika yang digunakan adalah
aes(x = book, y = polarity). - Gunakan
+untuk menambahkangeom_boxplot()dengancol = "darkred". Perhatikan dengan saksama garis gelap pada setiap kotak yang merepresentasikan median. - Selanjutnya tambahkan layer lain bernama
geom_jitter()untuk menambahkan titik bagi setiap kata.
- Estetika yang digunakan adalah
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Examine
___
# Summary by document
___
# Box plot
ggplot(___, aes(x = ___, y = ___)) +
___(fill = c("#bada55", "#F00B42", "#F001ED", "#BA6E15"), col = "___") +
___(position = position_jitter(width = 0.1, height = 0), alpha = 0.02) +
theme_gdocs() +
ggtitle("Book Polarity")