Mulai sekarangMulai gratis

Mengeksplorasi korpus R

Salah satu rekan kerja Anda telah menyiapkan korpus berisi 20 dokumen yang membahas minyak mentah, bernama crude. Ini hanyalah sampel dari beberapa ribu artikel yang akan Anda terima minggu depan. Untuk bersiap menjalankan analisis teks pada dokumen-dokumen ini, Anda memutuskan untuk menelusuri konten dan metadata-nya. Ingat bahwa dalam R, sebuah VCorpus memuat meta dan content untuk setiap teks. Dalam pelajaran ini, Anda akan mengeksplorasi kedua objek tersebut.

Latihan ini merupakan bagian dari kursus

Pengantar Natural Language Processing di R

Lihat Kursus

Instruksi latihan

  • Cetak crude dan tinjau hasilnya.
  • Cetak konten artikel ke-10.
  • Cetak ID artikel pertama dalam crude.
  • Dengan menggunakan for loop yang disediakan, buat sebuah vektor berisi ID dari korpus.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Print out the corpus
print(___)

# Print the content of the 10th article
crude[[___]]$___

# Find the first ID
crude[[___]]$___$id

# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
  ids <- append(ids, crude[[___]]$___$id)
}
Edit dan Jalankan Kode