Metin vektörleştirme
UFO veri kümesindeki desc sütununu tf/idf vektörlerine dönüştüreceksin; çünkü bu alandan öğrenebileceğimiz şeyler olması muhtemel.
Bu egzersiz, kursun bir parçasıdır
Python'da Machine Learning için Ön İşleme
Egzersiz talimatları
descsütununun.head()çıktısını yazdır.- Bir
TfidfVectorizer()nesnesi oluştur. descsütununuveckullanarak fit et ve dönüştür.- Oluşturulan sütun sayısına bakmak için
desc_tfidfvektörünün.shapedeğerini yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)