Porządkowanie transkrybowanych danych z rozmów telefonicznych

Jesteśmy już prawie gotowi do zbudowania klasyfikatora tekstu. Na razie wszystkie transkrybowane dane tekstowe znajdują się w dwóch listach: pre_purchase_text i post_purchase_text.

Aby lepiej je uporządkować – zarówno na potrzeby budowania klasyfikatora, jak i do przyszłego wykorzystania – umieścimy je w ramce danych pandas.

Na początku zaimportujemy pandas jako pd, a następnie utworzymy ramkę danych dla rozmów po zakupie: post_purchase_df, używając pd.DataFrame().

Do pd.DataFrame() przekażemy słownik zawierający klucz "label" z wartością "post_purchase" oraz klucz "text" z wartością listy post_purchase_text.

To samo zrobimy dla pre_purchase_df, tym razem używając listy pre_purchase_text.

Aby zebrać wszystkie dane w jednym miejscu, skorzystamy z pd.concat() i przekażemy do niego obie ramki danych.

Utwórz post_purchase_df na podstawie listy post_purchase_text.
Utwórz pre_purchase_df na podstawie listy pre_purchase_text.
Połącz obie ramki danych za pomocą pd.concat().

演習

Porządkowanie transkrybowanych danych z rozmów telefonicznych

指示

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習

指示

演習