BaşlayınÜcretsiz Başlayın

Özellik indekslerini özellik adlarıyla eşleme

Ders videosunda, CountVectorizer'ın kelime dağarcığını mutlaka alfabetik sırada indekslemediğini görmüştük. Bu egzersizde, her özellik indeksini sözlükteki karşılık gelen özellik adıyla nasıl eşleyeceğini öğreneceğiz.

Videodakiyle aynı, aslanlarla ilgili üç cümleyi kullanacağız. Cümleler, corpus adlı bir listede mevcut ve konsola zaten yazdırıldı.

Bu egzersiz

Python ile NLP için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir CountVectorizer nesnesi oluştur. Adı vectorizer olsun.
  • fit_transform() kullanarak corpus için bow_matrix oluştur.
  • get_feature_names() metodunu kullanarak sütun adlarını sözlükteki karşılık gelen kelimeyle eşle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create CountVectorizer object
vectorizer = ____

# Generate matrix of word vectors
bow_matrix = vectorizer.____(____)

# Convert bow_matrix into a DataFrame
bow_df = pd.DataFrame(bow_matrix.toarray())

# Map the column names to vocabulary 
bow_df.columns = vectorizer.____

# Print bow_df
print(bow_df)
Kodu Düzenle ve Çalıştır