Özellik indekslerini özellik adlarıyla eşleme
Ders videosunda, CountVectorizer'ın kelime dağarcığını mutlaka alfabetik sırada indekslemediğini görmüştük. Bu egzersizde, her özellik indeksini sözlükteki karşılık gelen özellik adıyla nasıl eşleyeceğini öğreneceğiz.
Videodakiyle aynı, aslanlarla ilgili üç cümleyi kullanacağız. Cümleler, corpus adlı bir listede mevcut ve konsola zaten yazdırıldı.
Bu egzersiz, kursun bir parçasıdır
Python ile NLP için Özellik Mühendisliği
Egzersiz talimatları
- Bir
CountVectorizernesnesi oluştur. Adıvectorizerolsun. fit_transform()kullanarakcorpusiçinbow_matrixoluştur.get_feature_names()metodunu kullanarak sütun adlarını sözlükteki karşılık gelen kelimeyle eşle.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create CountVectorizer object
vectorizer = ____
# Generate matrix of word vectors
bow_matrix = vectorizer.____(____)
# Convert bow_matrix into a DataFrame
bow_df = pd.DataFrame(bow_matrix.toarray())
# Map the column names to vocabulary
bow_df.columns = vectorizer.____
# Print bow_df
print(bow_df)