Seyrek terimleri kaldırma
Seyrek matrisler üzerinde sınıflandırma modelleri çalıştırmak hesaplama açısından kabus olabilir. GPU’lara ya da bulut hesaplama kaynaklarına erişimin yoksa, yerel bilgisayarında süre ve bellek sorunlarıyla karşılaşabilirsin. Sana bir belge-terim matrisi verildi ve en iyi sınıflandırma modelini bulmak için birkaç farklı algoritma çalıştırmayı planlıyorsun. Bu egzersizde, sağlanan matrix matrisinden farklı seyreklik düzeylerinde bazı seyrek terimleri kaldıracaksın.
Her seyreklik düzeyi için, matriste kalan terim sayısını not et.
Bu egzersiz, kursun bir parçasıdır
R ile Doğal Dil İşlemeye Giriş
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
less_sparse_matrix <-
___(___, sparse = ___)
# Print results
matrix
less_sparse_matrix