1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Regular Expressions nâng cao trong R

Connected

Bài tập

Dùng "or pattern" với bộ dữ liệu lớn hơn

Giờ khi bạn đã hiểu nguyên tắc nối nhiều khả năng từ một vector, hãy tiến thêm một bước và áp dụng nó cho một bộ dữ liệu lớn hơn. Trong phạm vi toàn cục có hai biến: articles và politicians. Biến thứ nhất là một tập hợp các bài báo về chính trị Thụy Sĩ. Biến còn lại là danh sách tên các chính trị gia Thụy Sĩ xuất hiện trong các bài báo.

Nhiệm vụ của bạn là tìm xem tên nào xuất hiện trong bài báo nào và mỗi chính trị gia xuất hiện bao nhiêu lần trong tất cả các bài báo.

Hướng dẫn

100 XP
  • Dùng vector politicians để tạo một biểu thức chính quy khớp với tất cả các tên được lưu trong vector đó.
  • Tạo một cột mới trong data frame articles chứa tất cả tên chính trị gia xuất hiện trong cột text.
  • Ghép tất cả bài báo lại với nhau để bạn dễ đếm số lần xuất hiện theo từng chính trị gia hơn.
  • Dùng vector politicians làm pattern và truyền nó vào str_count().