MulaiMulai sekarang secara gratis

Mengorganisasi data transkrip panggilan telepon

Kita hampir siap membangun pengklasifikasi teks. Namun saat ini, semua data teks hasil transkripsi kita berada dalam dua list, pre_purchase_text dan post_purchase_text.

Agar lebih tertata untuk membangun pengklasifikasi teks dan untuk penggunaan di masa depan, kita akan menggabungkannya ke dalam sebuah DataFrame pandas.

Mulai dengan mengimpor pandas sebagai pd, lalu buat DataFrame pembelian purnajual, post_purchase_df, menggunakan pd.DataFrame().

Berikan ke pd.DataFrame() sebuah dictionary yang berisi kunci "label" dengan nilai "post_purchase" dan kunci "text" dengan nilai list post_purchase_text kita.

Lakukan hal yang sama untuk pre_purchase_df, tetapi gunakan pre_purchase_text.

Agar semua data berada di satu tempat, gunakan pd.concat() dan berikan dua DataFrame pre dan post purchase tersebut.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Lisan dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat post_purchase_df menggunakan list post_purchase_text.
  • Buat pre_purchase_df menggunakan list pre_purchase_text.
  • Gabungkan kedua DataFrame menggunakan pd.concat().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

import pandas as pd

# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
                                 "text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
                                "text": ____})

# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])

# Print the combined DataFrame
print(df.head())
Edit dan Jalankan Kode