Metinden DataFrame'e
Artık bu sayım tabanlı özellikleri bir dizi olarak oluşturdun; bunları veri kümesinin geri kalanıyla birleştirilebilecek şekilde yeniden biçimlendirmen gerekiyor. Bunu, diziyi daha önce bulduğun özellik adlarını sütun adı olarak kullanan bir pandas DataFrame'ine dönüştürüp, ardından orijinal DataFrame ile birleştirerek yapabilirsin.
Son egzersizde oluşturduğun numpy dizisi (cv_array) ve vektörleştirici (cv) çalışma alanında mevcut.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
- Özellik adlarını sütun adı,
cv_array'i de değerler olacak şekilde bir DataFramecv_dfoluştur. - Tanımlamayı kolaylaştırmak için sütun adlarına
Counts_önekini ekle. - Bu DataFrame'i (
cv_df), orijinal DataFrame'e (speech_df) sütun bazında ekle (concatenate).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a DataFrame with these features
cv_df = pd.DataFrame(____,
columns=____).____('Counts_')
# Add the new columns to the original DataFrame
speech_df_new = ____([speech_df, cv_df], axis=1, sort=False)
print(speech_df_new.head())