1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Luyện tập với h2o

Có nhiều thư viện machine learning trong R. Tuy nhiên, thư viện h2o dễ dùng và có sẵn triển khai word2vec. h2o cũng có thể dùng cho nhiều tác vụ machine learning khác. Tuy nhiên, để dùng thư viện h2o, bạn cần thực hiện thêm một số bước tiền xử lý với dữ liệu. Bạn có một tập dữ liệu tên left_right chứa các tweet được tự động đăng trong chiến dịch bầu cử Mỹ năm 2016.

Thay vì chuẩn bị dữ liệu cho các kỹ thuật phân tích văn bản khác, hãy chuẩn bị tập dữ liệu này để sử dụng với thư viện h2o.

Hướng dẫn

100 XP
  • Import thư viện và khởi tạo một phiên h2o.
  • Tạo một đối tượng h2o.
  • Tách token các tweet được lưu ở cột content.
  • Chuyển tất cả từ về chữ thường và loại bỏ mọi stop words.