BaşlayınÜcretsiz Başlayın

Metinden DataFrame'e

Artık bu sayım tabanlı özellikleri bir dizi olarak oluşturdun; bunları veri kümesinin geri kalanıyla birleştirilebilecek şekilde yeniden biçimlendirmen gerekiyor. Bunu, diziyi daha önce bulduğun özellik adlarını sütun adı olarak kullanan bir pandas DataFrame'ine dönüştürüp, ardından orijinal DataFrame ile birleştirerek yapabilirsin.

Son egzersizde oluşturduğun numpy dizisi (cv_array) ve vektörleştirici (cv) çalışma alanında mevcut.

Bu egzersiz

Python ile Machine Learning için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Özellik adlarını sütun adı, cv_array'i de değerler olacak şekilde bir DataFrame cv_df oluştur.
  • Tanımlamayı kolaylaştırmak için sütun adlarına Counts_ önekini ekle.
  • Bu DataFrame'i (cv_df), orijinal DataFrame'e (speech_df) sütun bazında ekle (concatenate).

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create a DataFrame with these features
cv_df = pd.DataFrame(____, 
                     columns=____).____('Counts_')

# Add the new columns to the original DataFrame
speech_df_new = ____([speech_df, cv_df], axis=1, sort=False)
print(speech_df_new.head())
Kodu Düzenle ve Çalıştır