Metin vektörleştirme
UFO veri kümesindeki desc sütununu tf/idf vektörlerine dönüştüreceksin; çünkü bu alandan öğrenebileceğimiz şeyler olması muhtemel.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
descsütununun.head()çıktısını yazdır.- Bir
TfidfVectorizer()nesnesi oluştur. descsütununuveckullanarak fit et ve dönüştür.- Oluşturulan sütun sayısına bakmak için
desc_tfidfvektörünün.shapedeğerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)