Bir corpus oluşturma
Metin analizi yapabilmek için, 2016 ABD seçim döngüsü sırasında botlar tarafından otomatik olarak oluşturulmuş yaklaşık 20.000 tweet içeren russian_tweets adlı bir tibble oluşturdun. Yapmayı seçtiğin analizi gerçekleştirmek için mevcut seçeneklere baktığında, tm paketinin en kolay yolu sunduğunu düşünüyorsun. Analizi gerçekleştirebilmek için önce bir corpus oluşturman ve potansiyel olarak faydalı meta verileri eklemen gerekiyor.
Bunun gerçek Twitter verisi olduğunu ve bu nedenle küfür ya da rahatsız edici başka içerikler barındırma riski bulunduğunu unutma (bu egzersizde ve gerçek Twitter verisi kullanılan sonraki egzersizlerde de geçerlidir).
Bu egzersiz
R ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
russian_tweetsiçindekicontentsütununu kullanarak bir corpus oluştur.followingvefollowerssütunlarını meta veri olaraktweet_corpus'a ekle.- Meta veri tablosunun ilk birkaç satırını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))
# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___
# Review the meta data
head(meta(___))