BaşlayınÜcretsiz Başlayın

Adım 2: Metin Kaynaklarını Belirle

Bu kısa egzersizde Boston çevresindeki kiralık mülk yorumlarından oluşan küçük bir metin derlemesini (corpus) yükleyip inceleyeceksin. Virgülle ayrılmış bir dosyayı yüklemeyi sağlayan read.csv() fonksiyonunu umarım zaten biliyorsundur. Sıradan görünebilir ama bu bölümün amacı baştan sona tüm iş akışını uygulamana yardımcı olmak; o yüzden veriyi içeri almakla başlayalım!

Sonrasında veri çerçevesinin yapısını gözden geçirmek için str() uygula. Bu fonksiyon, vektörlerin başlangıç değerlerini ve sınıf türlerini derli toplu biçimde gösteren kullanışlı bir araçtır.

Son olarak veri çerçevesinin boyutlarını yazdırmak için dim() kullanacaksın. Bir veri çerçevesi için konsol satır sayısını ve sütun sayısını basar.

head(), tail() veya summary() gibi diğer fonksiyonlar da genelde veri keşfi için kullanılır; ancak bu durumda incelemeyi kısa tutuyoruz ki bir an önce eğlenceli duygu analizi kısmına geçebilesin!

Bu egzersiz

R ile Duygu Analizi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

Boston’daki kiralık mülk yorumları, önceden tanımlı bos_reviews_file değişkeninin gösterdiği bir CSV dosyasında tutuluyor.

  • read.csv() ile bos_reviews_file içindeki yorumları yükle. Nesnenin adı bos_reviews olsun.
  • Taban str() fonksiyonunu bos_reviews üzerinde çalıştırarak veri çerçevesinin yapısını incele.
  • Kaç yorumla çalıştığını öğrenmek için dim() fonksiyonunu bos_reviews üzerinde çağır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# bos_reviews_file has been pre-defined
bos_reviews_file

# load raw text
bos_reviews <- ___

# Structure
___

# Dimensions
___
Kodu Düzenle ve Çalıştır