Özellik indekslerini özellik adlarıyla eşleme

Ders videosunda, CountVectorizer'ın kelime dağarcığını mutlaka alfabetik sırada indekslemediğini görmüştük. Bu egzersizde, her özellik indeksini sözlükteki karşılık gelen özellik adıyla nasıl eşleyeceğini öğreneceğiz.

Videodakiyle aynı, aslanlarla ilgili üç cümleyi kullanacağız. Cümleler, corpus adlı bir listede mevcut ve konsola zaten yazdırıldı.

Bu egzersiz, kursun bir parçasıdır

Python ile NLP için Özellik Mühendisliği

Kursa Göz Atın

Egzersiz talimatları

Bir CountVectorizer nesnesi oluştur. Adı vectorizer olsun.
fit_transform() kullanarak corpus için bow_matrix oluştur.
get_feature_names() metodunu kullanarak sütun adlarını sözlükteki karşılık gelen kelimeyle eşle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create CountVectorizer object
vectorizer = ____

# Generate matrix of word vectors
bow_matrix = vectorizer.____(____)

# Convert bow_matrix into a DataFrame
bow_df = pd.DataFrame(bow_matrix.toarray())

# Map the column names to vocabulary 
bow_df.columns = vectorizer.____

# Print bow_df
print(bow_df)

Kodu Düzenle ve Çalıştır