BaşlayınÜcretsiz Başlayın

Yazıya dökülmüş telefon görüşmesi verilerini düzenleme

Bir metin sınıflandırıcı oluşturmaya neredeyse hazırız. Ama şu anda, yazıya dökülmüş tüm metin verilerimiz iki listede: pre_purchase_text ve post_purchase_text.

Bunu hem metin sınıflandırıcı kurarken hem de gelecekte kullanımı kolaylaştırmak için daha iyi organize etmek amacıyla hepsini bir pandas DataFrame'inde toplayacağız.

Önce pandaspd takma adıyla içe aktaracağız, sonra pd.DataFrame() kullanarak bir satış sonrası DataFrame'i, post_purchase_df oluşturacağız.

pd.DataFrame()'e, değeri "post_purchase" olan bir "label" anahtarı ve değeri post_purchase_text listemiz olan bir "text" anahtarı içeren bir sözlük vereceğiz.

Aynısını pre_purchase_df için de yapacağız, ama bu kez pre_purchase_text ile.

Tüm verilerin tek yerde olması için pd.concat() kullanıp ona satış öncesi ve satış sonrası DataFrame'lerini ileteceğiz.

Bu egzersiz

Python ile Konuşma Dili İşleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • post_purchase_text listesini kullanarak post_purchase_df oluştur.
  • pre_purchase_text listesini kullanarak pre_purchase_df oluştur.
  • İki DataFrame'i pd.concat() ile birleştir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

import pandas as pd

# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
                                 "text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
                                "text": ____})

# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])

# Print the combined DataFrame
print(df.head())
Kodu Düzenle ve Çalıştır