Data cuitan maskapai
Data frame twitter_data berisi lebih dari 7.000 cuitan tentang maskapai. Cuitan tersebut telah diklasifikasikan sebagai keluhan atau bukan keluhan pada kolom complaint_label. Mari melihat gambaran berapa banyak dari cuitan ini yang merupakan keluhan.
Harap diketahui bahwa ini adalah data asli dari Twitter dan dengan demikian selalu ada kemungkinan mengandung kata-kata kasar atau konten ofensif lainnya (dalam latihan ini, dan latihan berikutnya yang juga menggunakan data Twitter asli).
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Muat paket
tidyverse. - Dapatkan gambaran ukuran dan isi data dengan mencetak
twitter_data. - Saring
twitter_datasehingga hanya berisi keluhan. Ada berapa banyak keluhan dalam data?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)