BaşlayınÜcretsiz Başlayın

Vektörleri inceleme

Vektörlerin nasıl çalıştığını daha iyi anlamak için, onları pandas DataFrame’lerine dönüştürerek inceleyeceksin.

Burada, önceki iki egzersizde oluşturduğun aynı veri yapılarını (count_train, count_vectorizer, tfidf_train, tfidf_vectorizer) ve pd olarak içe aktarılan pandas’ı kullanacaksın.

Bu egzersiz

Python ile Doğal Dil İşlemeye Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • pd.DataFrame() kullanarak ve ilk argüman olarak değerleri, ikinci argüman olarak da sütunları (veya özellikleri) belirterek count_df ve tfidf_df DataFrame’lerini oluştur.
    • Değerlere, sırasıyla count_train ve tfidf_train nesnelerinin .A özniteliğiyle erişebilirsin.
    • Sütunlara, count_vectorizer ve tfidf_vectorizer nesnelerinin .get_feature_names() metodlarıyla erişebilirsin.
  • Yapılarını incelemek için her bir DataFrame’in başını yazdır. Bu senin için yapıldı.
  • Sütun adlarının her iki DataFrame’de de aynı olup olmadığını test etmek için, difference adlı yeni bir nesne oluşturarak count_df’nin tfidf_df’den farkı olan sütunlarını gör. DataFrame’in sütunlarına .columns özniteliğiyle erişebilirsin. set(count_df.columns) kümesinden set(tfidf_df.columns) kümesini çıkar.
  • İki DataFrame’in eşdeğer olup olmadığını test etmek için, count_df üzerinde .equals() metodunu tfidf_df argümanıyla kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create the CountVectorizer DataFrame: count_df
count_df = ____(____, columns=____)

# Create the TfidfVectorizer DataFrame: tfidf_df
tfidf_df = ____

# Print the head of count_df
print(count_df.head())

# Print the head of tfidf_df
print(tfidf_df.head())

# Calculate the difference in columns: difference
difference = set(____) - set(____)
print(difference)

# Check whether the DataFrames are equal
print(____)
Kodu Düzenle ve Çalıştır