or
Bu egzersiz, kursun bir parçasıdır
Metin, yapılandırılmamış bir veri türü olduğundan, analiz edilebilir bir forma getirmek için bir miktar düzenleme gerekir. Bu bölümde, metni tokenleştirerek, temizleyerek ve kategorik veri olarak ele alarak metne nasıl yapı kazandıracağını öğreneceksin.
Sayımlar faydalıdır ama görselleştirmeler daha etkilidir. Bu bölümde, ggplot2 bilgini tidy metin verisine nasıl uygulayacağını öğreneceksin.
Kelime sayımları ve görselleştirmeler içerik hakkında bir şeyler söyler, fakat daha fazlasını yapabiliriz. Bu bölümde, yalnızca kelime sayımlarının ötesine geçerek metnin duygu durumunu veya duygusal değerini analiz edeceğiz.
Bu son bölümde, kelime sayımlarının ötesine geçerek bir belge koleksiyonundaki temel konuları ortaya çıkaracağız. Latent Dirichlet allocation olarak bilinen standart bir konu modelini kullanacağız.
Geçerli egzersiz