MulaiMulai sekarang secara gratis

Mengeksplorasi korpus R

Salah satu rekan kerja Anda telah menyiapkan korpus berisi 20 dokumen yang membahas minyak mentah, bernama crude. Ini hanyalah sampel dari beberapa ribu artikel yang akan Anda terima minggu depan. Untuk bersiap menjalankan analisis teks pada dokumen-dokumen ini, Anda memutuskan untuk menelusuri konten dan metadata-nya. Ingat bahwa dalam R, sebuah VCorpus memuat meta dan content untuk setiap teks. Dalam pelajaran ini, Anda akan mengeksplorasi kedua objek tersebut.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di R

Lihat Kursus

Petunjuk latihan

  • Cetak crude dan tinjau hasilnya.
  • Cetak konten artikel ke-10.
  • Cetak ID artikel pertama dalam crude.
  • Dengan menggunakan for loop yang disediakan, buat sebuah vektor berisi ID dari korpus.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Print out the corpus
print(___)

# Print the content of the 10th article
crude[[___]]$___

# Find the first ID
crude[[___]]$___$id

# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
  ids <- append(ids, crude[[___]]$___$id)
}
Edit dan Jalankan Kode