1. 学ぶ
  2. /
  3. コース
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

演習

Porządkowanie transkrybowanych danych z rozmów telefonicznych

Jesteśmy już prawie gotowi do zbudowania klasyfikatora tekstu. Na razie wszystkie transkrybowane dane tekstowe znajdują się w dwóch listach: pre_purchase_text i post_purchase_text.

Aby lepiej je uporządkować – zarówno na potrzeby budowania klasyfikatora, jak i do przyszłego wykorzystania – umieścimy je w ramce danych pandas.

Na początku zaimportujemy pandas jako pd, a następnie utworzymy ramkę danych dla rozmów po zakupie: post_purchase_df, używając pd.DataFrame().

Do pd.DataFrame() przekażemy słownik zawierający klucz "label" z wartością "post_purchase" oraz klucz "text" z wartością listy post_purchase_text.

To samo zrobimy dla pre_purchase_df, tym razem używając listy pre_purchase_text.

Aby zebrać wszystkie dane w jednym miejscu, skorzystamy z pd.concat() i przekażemy do niego obie ramki danych.

指示

100 XP
  • Utwórz post_purchase_df na podstawie listy post_purchase_text.
  • Utwórz pre_purchase_df na podstawie listy pre_purchase_text.
  • Połącz obie ramki danych za pomocą pd.concat().