Mengorganisasi data transkrip panggilan telepon
Kita hampir siap membangun pengklasifikasi teks. Namun saat ini, semua data teks hasil transkripsi kita berada dalam dua list, pre_purchase_text dan post_purchase_text.
Agar lebih tertata untuk membangun pengklasifikasi teks dan untuk penggunaan di masa depan, kita akan menggabungkannya ke dalam sebuah DataFrame pandas.
Mulai dengan mengimpor pandas sebagai pd, lalu buat DataFrame pembelian purnajual, post_purchase_df, menggunakan pd.DataFrame().
Berikan ke pd.DataFrame() sebuah dictionary yang berisi kunci "label" dengan nilai "post_purchase" dan kunci "text" dengan nilai list post_purchase_text kita.
Lakukan hal yang sama untuk pre_purchase_df, tetapi gunakan pre_purchase_text.
Agar semua data berada di satu tempat, gunakan pd.concat() dan berikan dua DataFrame pre dan post purchase tersebut.
Latihan ini merupakan bagian dari kursus
Pemrosesan Bahasa Lisan dengan Python
Instruksi latihan
- Buat
post_purchase_dfmenggunakan listpost_purchase_text. - Buat
pre_purchase_dfmenggunakan listpre_purchase_text. - Gabungkan kedua DataFrame menggunakan
pd.concat().
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
import pandas as pd
# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
"text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
"text": ____})
# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])
# Print the combined DataFrame
print(df.head())