1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Luyện tập cú pháp với grep

Bạn vừa hoàn thành một hoạt động khởi động làm quen tại nơi làm việc và đã ghi lại 10 sự thật về sếp của mình. Bạn lưu 10 mục này vào một vector tên là text. Dùng biểu thức chính quy, bạn muốn tóm tắt các phản hồi của sếp.

Một vài lưu ý về biểu thức chính quy trong R:

  • Khi dùng grep(), đặt value = TRUE sẽ in ra chính văn bản thay vì chỉ số.
  • Bạn có thể kết hợp các mẫu như một chữ số, "\\d", theo sau bởi dấu chấm "\\.", thành "\\d\\."
  • Có thể tìm khoảng trắng bằng "\\s".
  • Bạn có thể tìm một từ chỉ bằng cách dùng chính từ đó làm mẫu. pattern = 'word'

Hướng dẫn

100 XP
  • Dùng grep() để in văn bản của các phản hồi có chứa một số.
  • Tìm tất cả các mục có một số theo sau bởi một khoảng trắng. Dùng biểu thức chính quy cho số và khoảng trắng.
  • Dùng length() và grep() để xem bạn đã ghi lại từ "favorite" bao nhiêu lần.