BaşlayınÜcretsiz başlayın

Metinden DataFrame'e

Artık bu sayım tabanlı özellikleri bir dizi olarak oluşturdun; bunları veri kümesinin geri kalanıyla birleştirilebilecek şekilde yeniden biçimlendirmen gerekiyor. Bunu, diziyi daha önce bulduğun özellik adlarını sütun adı olarak kullanan bir pandas DataFrame'ine dönüştürüp, ardından orijinal DataFrame ile birleştirerek yapabilirsin.

Son egzersizde oluşturduğun numpy dizisi (cv_array) ve vektörleştirici (cv) çalışma alanında mevcut.

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning için Özellik Mühendisliği

Kursa Göz Atın

Egzersiz talimatları

  • Özellik adlarını sütun adı, cv_array'i de değerler olacak şekilde bir DataFrame cv_df oluştur.
  • Tanımlamayı kolaylaştırmak için sütun adlarına Counts_ önekini ekle.
  • Bu DataFrame'i (cv_df), orijinal DataFrame'e (speech_df) sütun bazında ekle (concatenate).

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create a DataFrame with these features
cv_df = pd.DataFrame(____, 
                     columns=____).____('Counts_')

# Add the new columns to the original DataFrame
speech_df_new = ____([speech_df, cv_df], axis=1, sort=False)
print(speech_df_new.head())
Kodu Düzenle ve Çalıştır