1. 学ぶ
  2. /
  3. コース
  4. /
  5. Gradient Boosting Cực Mạnh với XGBoost

Connected

演習

Mã hóa cột phân loại III: DictVectorizer

Rồi, một mẹo cuối cùng trước khi bạn bắt tay vào pipelines. Quy trình hai bước bạn vừa làm - LabelEncoder rồi đến OneHotEncoder - có thể được đơn giản hóa bằng cách dùng DictVectorizer.

Dùng DictVectorizer trên một DataFrame đã được chuyển thành dictionary cho phép bạn thực hiện cả label encoding và one-hot encoding chỉ trong một lần.

Nhiệm vụ của bạn là áp dụng chiến lược này trong bài tập này!

指示

100 XP
  • Import DictVectorizer từ sklearn.feature_extraction.
  • Chuyển df thành một dictionary tên df_dict bằng phương thức .to_dict() với đối số "records".
  • Khởi tạo một đối tượng DictVectorizer tên dv với tham số sparse=False.
  • Áp dụng DictVectorizer lên df_dict bằng phương thức .fit_transform().
  • Nhấn 'Gửi câu trả lời' để in ra 5 hàng đầu tiên thu được và vocabulary.