Metinden DataFrame'e
Artık bu sayım tabanlı özellikleri bir dizi olarak oluşturdun; bunları veri kümesinin geri kalanıyla birleştirilebilecek şekilde yeniden biçimlendirmen gerekiyor. Bunu, diziyi daha önce bulduğun özellik adlarını sütun adı olarak kullanan bir pandas DataFrame'ine dönüştürüp, ardından orijinal DataFrame ile birleştirerek yapabilirsin.
Son egzersizde oluşturduğun numpy dizisi (cv_array) ve vektörleştirici (cv) çalışma alanında mevcut.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning için Özellik Mühendisliği
Egzersiz talimatları
- Özellik adlarını sütun adı,
cv_array'i de değerler olacak şekilde bir DataFramecv_dfoluştur. - Tanımlamayı kolaylaştırmak için sütun adlarına
Counts_önekini ekle. - Bu DataFrame'i (
cv_df), orijinal DataFrame'e (speech_df) sütun bazında ekle (concatenate).
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a DataFrame with these features
cv_df = pd.DataFrame(____,
columns=____).____('Counts_')
# Add the new columns to the original DataFrame
speech_df_new = ____([speech_df, cv_df], axis=1, sort=False)
print(speech_df_new.head())