1. Learn
  2. /
  3. Courses
  4. /
  5. Mạng nơ-ron hồi quy (RNN) cho Mô hình ngôn ngữ với Keras

Connected

Exercise

Chuẩn bị các vector nhãn

Trong bài học video, bạn đã học sự khác biệt giữa phân loại nhị phân và phân loại đa lớp. Bạn cũng đã thấy rằng cần điều chỉnh một số bước trong quy trình tiền xử lý dữ liệu trước khi huấn luyện mô hình.

Trong bài tập này, bạn sẽ xử lý một tập dữ liệu thô với nhãn ở dạng văn bản. Dữ liệu được cung cấp dưới dạng pandas.DataFrame tên df, gồm hai cột: text chứa dữ liệu văn bản và label chứa tên nhãn. Nhiệm vụ của bạn là thực hiện mọi biến đổi cần thiết cho các nhãn: chuyển chuỗi thành số và mã hóa one-hot.

Module pandas với bí danh pd và hàm to_categorical() từ keras.utils.np_utils đã được nạp sẵn trong môi trường và vài dòng đầu của tập dữ liệu đã được in ra bảng điều khiển để bạn quan sát.

Instructions 1/3

undefined XP
    1
    2
    3
  • Lấy thuộc tính .cat.codes của cột label trong data frame df và in ra kích thước (shape) của nó.