Mã hóa cột phân loại III: DictVectorizer

Rồi, một mẹo cuối cùng trước khi bạn bắt tay vào pipelines. Quy trình hai bước bạn vừa làm - LabelEncoder rồi đến OneHotEncoder - có thể được đơn giản hóa bằng cách dùng DictVectorizer.

Dùng DictVectorizer trên một DataFrame đã được chuyển thành dictionary cho phép bạn thực hiện cả label encoding và one-hot encoding chỉ trong một lần.

Nhiệm vụ của bạn là áp dụng chiến lược này trong bài tập này!

Import DictVectorizer từ sklearn.feature_extraction.
Chuyển df thành một dictionary tên df_dict bằng phương thức .to_dict() với đối số "records".
Khởi tạo một đối tượng DictVectorizer tên dv với tham số sparse=False.
Áp dụng DictVectorizer lên df_dict bằng phương thức .fit_transform().
Nhấn 'Gửi câu trả lời' để in ra 5 hàng đầu tiên thu được và vocabulary.

Bài tập

Mã hóa cột phân loại III: DictVectorizer

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập