Yazıya dökülmüş telefon görüşmesi verilerini düzenleme
Bir metin sınıflandırıcı oluşturmaya neredeyse hazırız. Ama şu anda, yazıya dökülmüş tüm metin verilerimiz iki listede: pre_purchase_text ve post_purchase_text.
Bunu hem metin sınıflandırıcı kurarken hem de gelecekte kullanımı kolaylaştırmak için daha iyi organize etmek amacıyla hepsini bir pandas DataFrame'inde toplayacağız.
Önce pandas'ı pd takma adıyla içe aktaracağız, sonra pd.DataFrame() kullanarak bir satış sonrası DataFrame'i, post_purchase_df oluşturacağız.
pd.DataFrame()'e, değeri "post_purchase" olan bir "label" anahtarı ve değeri post_purchase_text listemiz olan bir "text" anahtarı içeren bir sözlük vereceğiz.
Aynısını pre_purchase_df için de yapacağız, ama bu kez pre_purchase_text ile.
Tüm verilerin tek yerde olması için pd.concat() kullanıp ona satış öncesi ve satış sonrası DataFrame'lerini ileteceğiz.
Bu egzersiz
Python ile Konuşma Dili İşleme
kursunun bir parçasıdırEgzersiz talimatları
post_purchase_textlistesini kullanarakpost_purchase_dfoluştur.pre_purchase_textlistesini kullanarakpre_purchase_dfoluştur.- İki DataFrame'i
pd.concat()ile birleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
import pandas as pd
# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
"text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
"text": ____})
# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])
# Print the combined DataFrame
print(df.head())