1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán với dữ liệu mạng trong R

Connected

Bài tập

Chia thành tập huấn luyện và kiểm tra

Giờ chúng ta đã có một dataframe, bạn có thể áp dụng các kỹ thuật mô hình hóa tiêu chuẩn. Trong bài tập này, bạn sẽ chia dữ liệu thành tập huấn luyện và tập kiểm tra.

Hướng dẫn

100 XP
  • Để đảm bảo khả năng tái lập kết quả, đặt seed bằng 7 với set.seed().
  • Dùng hàm sample() để lấy mẫu hai phần ba số lượng từ dãy số trong phạm vi tổng số hàng của studentnetworkdata. Đặt tên vector này là index_train.
  • Tạo tập huấn luyện bằng cách lấy các hàng của studentnetworkdata có chỉ mục nằm trong index_train và đặt tên là training_set.
  • Tạo tập kiểm tra bằng cách loại trừ các hàng của studentnetworkdata có chỉ mục nằm trong index_train và đặt tên là test_set.