Mengorganisasi data transkrip panggilan telepon
Kita hampir siap membangun pengklasifikasi teks. Namun saat ini, semua data teks hasil transkripsi kita berada dalam dua list, pre_purchase_text dan post_purchase_text.
Agar lebih tertata untuk membangun pengklasifikasi teks dan untuk penggunaan di masa depan, kita akan menggabungkannya ke dalam sebuah DataFrame pandas.
Mulai dengan mengimpor pandas sebagai pd, lalu buat DataFrame pembelian purnajual, post_purchase_df, menggunakan pd.DataFrame().
Berikan ke pd.DataFrame() sebuah dictionary yang berisi kunci "label" dengan nilai "post_purchase" dan kunci "text" dengan nilai list post_purchase_text kita.
Lakukan hal yang sama untuk pre_purchase_df, tetapi gunakan pre_purchase_text.
Agar semua data berada di satu tempat, gunakan pd.concat() dan berikan dua DataFrame pre dan post purchase tersebut.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Lisan dengan Python
Petunjuk latihan
- Buat
post_purchase_dfmenggunakan listpost_purchase_text. - Buat
pre_purchase_dfmenggunakan listpre_purchase_text. - Gabungkan kedua DataFrame menggunakan
pd.concat().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import pandas as pd
# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
"text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
"text": ____})
# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])
# Print the combined DataFrame
print(df.head())