Adım 2: Metin Kaynaklarını Belirle
Bu kısa egzersizde Boston çevresindeki kiralık mülk yorumlarından oluşan küçük bir metin derlemesini (corpus) yükleyip inceleyeceksin. Virgülle ayrılmış bir dosyayı yüklemeyi sağlayan read.csv() fonksiyonunu umarım zaten biliyorsundur. Sıradan görünebilir ama bu bölümün amacı baştan sona tüm iş akışını uygulamana yardımcı olmak; o yüzden veriyi içeri almakla başlayalım!
Sonrasında veri çerçevesinin yapısını gözden geçirmek için str() uygula. Bu fonksiyon, vektörlerin başlangıç değerlerini ve sınıf türlerini derli toplu biçimde gösteren kullanışlı bir araçtır.
Son olarak veri çerçevesinin boyutlarını yazdırmak için dim() kullanacaksın. Bir veri çerçevesi için konsol satır sayısını ve sütun sayısını basar.
head(), tail() veya summary() gibi diğer fonksiyonlar da genelde veri keşfi için kullanılır; ancak bu durumda incelemeyi kısa tutuyoruz ki bir an önce eğlenceli duygu analizi kısmına geçebilesin!
Bu egzersiz
R ile Duygu Analizi
kursunun bir parçasıdırEgzersiz talimatları
Boston’daki kiralık mülk yorumları, önceden tanımlı bos_reviews_file değişkeninin gösterdiği bir CSV dosyasında tutuluyor.
read.csv()ilebos_reviews_fileiçindeki yorumları yükle. Nesnenin adıbos_reviewsolsun.- Taban
str()fonksiyonunubos_reviewsüzerinde çalıştırarak veri çerçevesinin yapısını incele. - Kaç yorumla çalıştığını öğrenmek için
dim()fonksiyonunubos_reviewsüzerinde çağır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# bos_reviews_file has been pre-defined
bos_reviews_file
# load raw text
bos_reviews <- ___
# Structure
___
# Dimensions
___