or
Bu egzersiz, kursun bir parçasıdır
Kelime sayısı, karakter sayısı, ortalama kelime uzunluğu ve özel karakter sayısı (örneğin Twitter hashtag’leri ve bahsetmeler) gibi temel özellikleri hesaplamayı öğren. Ayrıca okunabilirlik puanlarını hesaplamayı ve bir metni anlamak için gereken eğitim düzeyini belirlemeyi öğreneceksin.
Bu bölümde, tokenization ve lemmatization konularını öğreneceksin. Ardından, spaCy kütüphanesini kullanarak metin temizleme, part-of-speech etiketleme ve adlandırılmış varlık tanıma yapmayı öğreneceksin. Bu kavramları pekiştirdikten sonra, Gettysburg konuşmasını makine dostu hale getirecek, sahte haberlerde isim (noun) kullanımını analiz edecek ve bir TechCrunch makalesinde adı geçen kişileri belirleyeceksin.
N-gram modellemeyi öğren ve bunu kullanarak film yorumları üzerinde duygu analizi yap.
Tf-idf ağırlıklarını ve iki vektör arasındaki cosine similarity puanını nasıl hesaplayacağını öğren. Bu kavramları kullanarak bir film ve bir TED Talk öneri sistemi kuracaksın. Son olarak, kelime gömmeleri hakkında da bilgi edinecek ve kelime vektör temsillerini kullanarak çeşitli Pink Floyd şarkıları arasındaki benzerlikleri hesaplayacaksın.
Geçerli egzersiz