1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Viết mã hiệu quả với pandas

Connected

Bài tập

Chọn hàng ngẫu nhiên

Trong bài tập này, bạn sẽ so sánh hai phương pháp đã nêu để chọn các hàng (bản ghi) ngẫu nhiên có hoàn lại trong một DataFrame pandas:

  • Hàm tích hợp của pandas là .random()
  • Bộ sinh số nguyên ngẫu nhiên của NumPy np.random.randint()

Nói chung, trong thống kê và Machine Learning, khi cần huấn luyện một thuật toán, chúng ta huấn luyện trên 75% dữ liệu hiện có và kiểm tra hiệu năng trên 25% còn lại.

Trong bài này, bạn sẽ lấy mẫu ngẫu nhiên 75% tổng số ván bài poker đã chơi bằng mỗi phương pháp ở trên và kiểm tra phương pháp nào hiệu quả hơn về tốc độ.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Chọn ngẫu nhiên 75% số hàng của bộ dữ liệu poker bằng phương pháp np.random.randint().