Tokenlaştırma ve sayma
twitter_data içindeki havayolu tweet'lerinin içeriğini kelime sayımlarıyla keşfet. Her tweet'in içeriği tweet_text sütununda.
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- tidyverse ve tidytext paketlerini yükle.
tweet_textsütunundaki tweet'leri tokenlaştır.- Tokenlaştırılmış metni kullanarak kelime sayılarını hesapla.
- Sayımları azalan düzende sırala.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the tidyverse and tidytext packages
___(___)
___(___)
tidy_twitter <- twitter_data %>%
# Tokenize the twitter data
___(word, ___)
tidy_twitter %>%
# Compute word counts
___(___) %>%
# Arrange the counts in descending order
___(___)