MulaiMulai sekarang secara gratis

Box plot

Cara mudah untuk membandingkan banyak distribusi adalah dengan box plot. Kode ini akan membantu Anda membuat beberapa box plot untuk menghasilkan visual yang ringkas.

Dalam latihan ini objek all_book_polarity sudah dimuat. Data frame ini berisi dua kolom, book dan polarity. Objek ini mencakup semua buku dengan fungsi polarity() dari qdap yang diterapkan. Berikut 3 baris pertama dari objek besar tersebut.

book polarity
14 huck 0.2773501
22 huck 0.2581989
26 huck -0.5773503

Latihan ini memperkenalkan tapply() yang memungkinkan Anda menerapkan fungsi pada array tak beraturan. Anda memasukkan sebuah vektor nilai lalu sebuah vektor faktor. Untuk setiap kombinasi faktor dan nilai, parameter ketiga, yaitu sebuah fungsi seperti min(), akan diterapkan. Sebagai contoh, berikut kode dengan tapply() yang digunakan pada dua vektor.

f1 <- as.factor(c("Group1", "Group2", "Group1", "Group2"))
stat1 <- c(1, 2, 1, 2)
tapply(stat1, f1, sum)

Hasilnya adalah sebuah array di mana Group1 memiliki nilai 2 (1+1) dan Group2 memiliki nilai 4 (2+2).

Latihan ini adalah bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Petunjuk latihan

  • Karena sudah dimuat, periksa all_book_polarity dengan str().
  • Dengan menggunakan tapply(), masukkan all_book_polarity$polarity, all_book_polarity$book, dan fungsi summary(). Ini akan menampilkan statistik ringkas untuk keempat buku berdasarkan skor polarity()-nya. Anda akan mendapati Oz dan Huck Finn memiliki rata-rata lebih tinggi daripada Agamemnon atau Moby Dick. Perhatikan dengan saksama median.
  • Buat box plot dengan ggplot() dengan memasukkan all_book_polarity.
    • Estetika yang digunakan adalah aes(x = book, y = polarity).
    • Gunakan + untuk menambahkan geom_boxplot() dengan col = "darkred". Perhatikan dengan saksama garis gelap pada setiap kotak yang merepresentasikan median.
    • Selanjutnya tambahkan layer lain bernama geom_jitter() untuk menambahkan titik bagi setiap kata.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Examine
___

# Summary by document
___

# Box plot
ggplot(___, aes(x = ___, y = ___)) +
  ___(fill = c("#bada55", "#F00B42", "#F001ED", "#BA6E15"), col = "___") +
  ___(position = position_jitter(width = 0.1, height = 0), alpha = 0.02) +
  theme_gdocs() +
  ggtitle("Book Polarity")
Edit dan Jalankan Kode