1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Khám phá một corpus trong R

Một đồng nghiệp đã chuẩn bị một corpus gồm 20 tài liệu bàn về dầu thô, đặt tên là crude. Đây chỉ là mẫu trong số vài nghìn bài viết bạn sẽ nhận vào tuần tới. Để sẵn sàng chạy phân tích văn bản trên các tài liệu này, bạn quyết định khám phá nội dung và siêu dữ liệu của chúng. Hãy nhớ rằng trong R, một VCorpus chứa cả meta và content cho mỗi văn bản. Trong bài học này, bạn sẽ khám phá hai đối tượng đó.

Hướng dẫn

100 XP
  • In ra crude và xem kết quả.
  • In nội dung của bài viết thứ 10.
  • In ID của bài viết đầu tiên trong crude.
  • Dùng vòng lặp for đã cho để tạo một vector các ID từ corpus.