Bir R derlemini keşfet
İş arkadaşlarından biri, ham petrolü konu alan 20 belgeden oluşan ve crude adlı bir derlem hazırladı. Bu, gelecek hafta alacağın birkaç bin makalenin sadece küçük bir örneği. Bu belgelerde metin analizi çalıştırmaya hazırlanmak için içeriklerini ve üst verilerini keşfetmeye karar verdin. R'de bir VCorpusun her metne ilişkin hem meta hem de content içerdiğini unutma. Bu derste bu iki nesneyi keşfedeceksin.
Bu egzersiz
R ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
crude'u yazdır ve çıktıyı incele.- makalenin içeriğini yazdır.
crudeiçindeki ilk makalenin kimliğini (ID) yazdır.- Verilen for döngüsünü kullanarak derlemdeki kimliklerden bir vektör oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print out the corpus
print(___)
# Print the content of the 10th article
crude[[___]]$___
# Find the first ID
crude[[___]]$___$id
# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
ids <- append(ids, crude[[___]]$___$id)
}