1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ音声言語処理

Connected

演習

文字起こしした電話対応データの整理

テキスト分類器を作る準備がほぼ整いました。ただし現時点では、文字起こししたテキストは pre_purchase_text と post_purchase_text の2つのリストに分かれています。

テキスト分類器の構築や今後の活用のために、これらを1つの pandas DataFrame にまとめて整理しましょう。

まず pandas を pd としてインポートし、pd.DataFrame() を使って購入後データのDataFrameである post_purchase_df を作成します。

pd.DataFrame() には、"label" キーに "post_purchase"、"text" キーに post_purchase_text リストを指定した辞書を渡します。

pre_purchase_df についても同様に、pre_purchase_text を使って作成します。

すべてのデータを1か所にまとめるため、pd.concat() を使って購入前後のDataFrameを結合します。

指示

100 XP
  • post_purchase_text リストを使って post_purchase_df を作成します。
  • pre_purchase_text リストを使って pre_purchase_df を作成します。
  • pd.concat() を使って2つのDataFrameを結合します。