Özellik indekslerini özellik adlarıyla eşleme
Ders videosunda, CountVectorizer'ın kelime dağarcığını mutlaka alfabetik sırada indekslemediğini görmüştük. Bu egzersizde, her özellik indeksini sözlükteki karşılık gelen özellik adıyla nasıl eşleyeceğini öğreneceğiz.
Videodakiyle aynı, aslanlarla ilgili üç cümleyi kullanacağız. Cümleler, corpus adlı bir listede mevcut ve konsola zaten yazdırıldı.
Bu egzersiz
Python ile NLP için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
- Bir
CountVectorizernesnesi oluştur. Adıvectorizerolsun. fit_transform()kullanarakcorpusiçinbow_matrixoluştur.get_feature_names()metodunu kullanarak sütun adlarını sözlükteki karşılık gelen kelimeyle eşle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create CountVectorizer object
vectorizer = ____
# Generate matrix of word vectors
bow_matrix = vectorizer.____(____)
# Convert bow_matrix into a DataFrame
bow_df = pd.DataFrame(bow_matrix.toarray())
# Map the column names to vocabulary
bow_df.columns = vectorizer.____
# Print bow_df
print(bow_df)