Uspořádání přepsaných dat z telefonních hovorů

Jsme skoro připraveni sestavit textový klasifikátor. Zatím jsou ale všechna přepsaná textová data uložena ve dvou seznamech: pre_purchase_text a post_purchase_text.

Aby se s nimi lépe pracovalo – jak při budování klasifikátoru, tak do budoucna – přesuneme je do pandas DataFrame.

Nejprve importujeme pandas jako pd a pak vytvoříme DataFrame pro hovory po nákupu, post_purchase_df, pomocí pd.DataFrame().

Do pd.DataFrame() předáme slovník s klíčem "label" a hodnotou "post_purchase" a klíčem "text" s hodnotou našeho seznamu post_purchase_text.

Stejný postup zopakujeme pro pre_purchase_df, tentokrát se seznamem pre_purchase_text.

Abychom měli všechna data na jednom místě, použijeme pd.concat() a předáme mu oba DataFramy – před i po nákupu.

Vytvoř post_purchase_df pomocí seznamu post_purchase_text.
Vytvoř pre_purchase_df pomocí seznamu pre_purchase_text.
Spoj oba DataFramy pomocí pd.concat().

cvičení

Uspořádání přepsaných dat z telefonních hovorů

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení