Kitap açıklamalarına TF-IDF uygulama
PyBooks, birkaç kitap açıklaması topladı ve bunlardaki önemli kelimeleri TF-IDF kodlama tekniğiyle belirlemek istiyor. Bunu yaparak, her bir kitabın kendine özgü özellikleri hakkında daha fazla içgörü edinmeyi ve kitap öneri sistemlerine yardımcı olmayı umuyorlar.
Aşağıdaki paketler senin için içe aktarıldı: torch, torchtext.
Bu egzersiz
PyTorch ile Metin için Deep Learning
kursunun bir parçasıdırEgzersiz talimatları
- Ham doküman koleksiyonunu TF-IDF özelliklerinden oluşan bir matrise dönüştüren
sklearn.feature_extraction.textiçindekiTfidfVectorizersınıfını içe aktar. - Bu sınıftan bir nesne oluştur ve bu nesneyi kullanarak
descriptionsdeğişkenini TF-IDF vektör matrisine kodla. vectorizerüzerinden ilk beş özellik adını vetfidf_encoded_descriptionsiçindeki kodlanmış vektörleri alıp görüntüle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Importing TF-IDF from sklearn
from sklearn.feature_extraction.text import ____
# Initialize TF-IDF encoding vectorizer
vectorizer = ____()
tfidf_encoded_descriptions = vectorizer.____(descriptions)
# Extract and print the first five features
print(____.get_feature_names_out()[:5])
print(____.toarray()[0, :5])