BaşlayınÜcretsiz Başlayın

Tokenlaştırma ve sayma

twitter_data içindeki havayolu tweet'lerinin içeriğini kelime sayımlarıyla keşfet. Her tweet'in içeriği tweet_text sütununda.

Bu egzersiz

R ile Metin Analizine Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • tidyverse ve tidytext paketlerini yükle.
  • tweet_text sütunundaki tweet'leri tokenlaştır.
  • Tokenlaştırılmış metni kullanarak kelime sayılarını hesapla.
  • Sayımları azalan düzende sırala.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Kodu Düzenle ve Çalıştır