Bir corpus oluşturma
Metin analizi yapabilmek için, 2016 ABD seçim döngüsü sırasında botlar tarafından otomatik olarak oluşturulmuş yaklaşık 20.000 tweet içeren russian_tweets adlı bir tibble oluşturdun. Yapmayı seçtiğin analizi gerçekleştirmek için mevcut seçeneklere baktığında, tm paketinin en kolay yolu sunduğunu düşünüyorsun. Analizi gerçekleştirebilmek için önce bir corpus oluşturman ve potansiyel olarak faydalı meta verileri eklemen gerekiyor.
Bunun gerçek Twitter verisi olduğunu ve bu nedenle küfür ya da rahatsız edici başka içerikler barındırma riski bulunduğunu unutma (bu egzersizde ve gerçek Twitter verisi kullanılan sonraki egzersizlerde de geçerlidir).
Bu egzersiz, kursun bir parçasıdır
R ile Doğal Dil İşlemeye Giriş
Egzersiz talimatları
russian_tweetsiçindekicontentsütununu kullanarak bir corpus oluştur.followingvefollowerssütunlarını meta veri olaraktweet_corpus'a ekle.- Meta veri tablosunun ilk birkaç satırını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))
# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___
# Review the meta data
head(meta(___))