BaşlayınÜcretsiz Başlayın

Kitap açıklamalarına TF-IDF uygulama

PyBooks, birkaç kitap açıklaması topladı ve bunlardaki önemli kelimeleri TF-IDF kodlama tekniğiyle belirlemek istiyor. Bunu yaparak, her bir kitabın kendine özgü özellikleri hakkında daha fazla içgörü edinmeyi ve kitap öneri sistemlerine yardımcı olmayı umuyorlar.

Aşağıdaki paketler senin için içe aktarıldı: torch, torchtext.

Bu egzersiz

PyTorch ile Metin için Deep Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Ham doküman koleksiyonunu TF-IDF özelliklerinden oluşan bir matrise dönüştüren sklearn.feature_extraction.text içindeki TfidfVectorizer sınıfını içe aktar.
  • Bu sınıftan bir nesne oluştur ve bu nesneyi kullanarak descriptions değişkenini TF-IDF vektör matrisine kodla.
  • vectorizer üzerinden ilk beş özellik adını ve tfidf_encoded_descriptions içindeki kodlanmış vektörleri alıp görüntüle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Importing TF-IDF from sklearn
from sklearn.feature_extraction.text import ____

# Initialize TF-IDF encoding vectorizer
vectorizer = ____()
tfidf_encoded_descriptions = vectorizer.____(descriptions)

# Extract and print the first five features
print(____.get_feature_names_out()[:5])
print(____.toarray()[0, :5])
Kodu Düzenle ve Çalıştır