BaşlayınÜcretsiz Başlayın

Bir corpus oluşturma

Metin analizi yapabilmek için, 2016 ABD seçim döngüsü sırasında botlar tarafından otomatik olarak oluşturulmuş yaklaşık 20.000 tweet içeren russian_tweets adlı bir tibble oluşturdun. Yapmayı seçtiğin analizi gerçekleştirmek için mevcut seçeneklere baktığında, tm paketinin en kolay yolu sunduğunu düşünüyorsun. Analizi gerçekleştirebilmek için önce bir corpus oluşturman ve potansiyel olarak faydalı meta verileri eklemen gerekiyor.

Bunun gerçek Twitter verisi olduğunu ve bu nedenle küfür ya da rahatsız edici başka içerikler barındırma riski bulunduğunu unutma (bu egzersizde ve gerçek Twitter verisi kullanılan sonraki egzersizlerde de geçerlidir).

Bu egzersiz

R ile Doğal Dil İşlemeye Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • russian_tweets içindeki content sütununu kullanarak bir corpus oluştur.
  • following ve followers sütunlarını meta veri olarak tweet_corpus'a ekle.
  • Meta veri tablosunun ilk birkaç satırını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))

# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___

# Review the meta data
head(meta(___))
Kodu Düzenle ve Çalıştır