1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zpracování mluveného jazyka v Pythonu

Connected

cvičení

Uspořádání přepsaných dat z telefonních hovorů

Jsme skoro připraveni sestavit textový klasifikátor. Zatím jsou ale všechna přepsaná textová data uložena ve dvou seznamech: pre_purchase_text a post_purchase_text.

Aby se s nimi lépe pracovalo – jak při budování klasifikátoru, tak do budoucna – přesuneme je do pandas DataFrame.

Nejprve importujeme pandas jako pd a pak vytvoříme DataFrame pro hovory po nákupu, post_purchase_df, pomocí pd.DataFrame().

Do pd.DataFrame() předáme slovník s klíčem "label" a hodnotou "post_purchase" a klíčem "text" s hodnotou našeho seznamu post_purchase_text.

Stejný postup zopakujeme pro pre_purchase_df, tentokrát se seznamem pre_purchase_text.

Abychom měli všechna data na jednom místě, použijeme pd.concat() a předáme mu oba DataFramy – před i po nákupu.

Pokyny

100 XP
  • Vytvoř post_purchase_df pomocí seznamu post_purchase_text.
  • Vytvoř pre_purchase_df pomocí seznamu pre_purchase_text.
  • Spoj oba DataFramy pomocí pd.concat().