Mengeksplorasi korpus R
Salah satu rekan kerja Anda telah menyiapkan korpus berisi 20 dokumen yang membahas minyak mentah, bernama crude. Ini hanyalah sampel dari beberapa ribu artikel yang akan Anda terima minggu depan. Untuk bersiap menjalankan analisis teks pada dokumen-dokumen ini, Anda memutuskan untuk menelusuri konten dan metadata-nya. Ingat bahwa dalam R, sebuah VCorpus memuat meta dan content untuk setiap teks. Dalam pelajaran ini, Anda akan mengeksplorasi kedua objek tersebut.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di R
Petunjuk latihan
- Cetak
crudedan tinjau hasilnya. - Cetak konten artikel ke-10.
- Cetak ID artikel pertama dalam
crude. - Dengan menggunakan for loop yang disediakan, buat sebuah vektor berisi ID dari korpus.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print out the corpus
print(___)
# Print the content of the 10th article
crude[[___]]$___
# Find the first ID
crude[[___]]$___$id
# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
ids <- append(ids, crude[[___]]$___$id)
}