Menghapus term jarang (sparse)
Menjalankan model klasifikasi pada matriks jarang (sparse matrix) bisa menjadi tantangan komputasi. Tanpa akses ke GPU atau sumber daya komputasi cloud, Anda mungkin mengalami kendala waktu dan memori di komputer lokal. Anda telah menerima matriks dokumen-term dan berencana menjalankan beberapa algoritme berbeda untuk menemukan model klasifikasi terbaik. Pada latihan ini, Anda akan menghapus sebagian term yang jarang dari matriks yang diberikan, matrix, pada berbagai tingkat sparsite.
Untuk setiap tingkat sparsite, catat jumlah term yang tersisa dalam matriks.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
less_sparse_matrix <-
___(___, sparse = ___)
# Print results
matrix
less_sparse_matrix