MulaiMulai sekarang secara gratis

Menghitung jenis pengguna

Hitungan adalah ringkasan esensial untuk data kategorikal. Karena teks bersifat kategorikal, penting untuk terbiasa menghitung jumlah kemunculan. twitter_data terdiri dari keluhan dan non-keluhan, seperti ditunjukkan oleh kolom complaint_label, dan juga mencakup kolom yang menunjukkan apakah pengguna terverifikasi atau tidak (artinya, mereka telah dikonfirmasi oleh Twitter sebagai identitas yang mereka klaim) bernama usr_verified. Perhatikan bahwa kolom tersebut bertipe <lgl>, yaitu logis. Apakah pengguna terverifikasi lebih sering mengeluh?

Latihan ini adalah bagian dari kursus

Pengantar Analisis Teks di R

Lihat Kursus

Petunjuk latihan

  • Muat paket tidyverse, yang mencakup dplyr dan ggplot2.
  • Saring data untuk hanya mempertahankan tweet yang merupakan keluhan.
  • Hitung jumlah pengguna terverifikasi dan tidak terverifikasi yang mengeluh.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the tidyverse package
___(___)

twitter_data %>% 
  # Filter for just the complaints
  ___(___) %>% 
  # Count the number of verified and non-verified users
  ___(___)
Edit dan Jalankan Kode