1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

テキストを DataFrame に変換

これでカウントに基づく特徴量を配列として作成できました。次は、ほかのデータセットと結合できるように形式を整えます。具体的には、この配列を pandas の DataFrame に変換し、前の手順で取得した特徴量名を列名として設定してから、元の DataFrame に連結します。

前の演習で作成した numpy 配列(cv_array)とベクトライザー(cv)は、ワークスペースに用意されています。

指示

100 XP
  • 値に cv_array を用い、列名に特徴量名を使った DataFrame cv_df を作成します。
  • 識別しやすいように、列名に接頭辞 Counts_ を追加します。
  • この DataFrame(cv_df)を、元の DataFrame(speech_df)に列方向で連結します。