1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Trénování a testování modelu pro detekci fake news pomocí CountVectorizeru

Teď přichází tvoje chvíle — natrénuj model pro detekci fake news na základě příznaků, které jsi identifikoval/a a extrahoval/a. V tomto prvním cvičení natrénuješ a otestuješ model Naivního Bayese s využitím dat z CountVectorizeru.

Trénovací a testovací sady jsou připravené a proměnné count_vectorizer, count_train a count_test jsou již vypočítané.

Pokyny

100 XP
  • Importuj modul metrics z sklearn a MultinomialNB z sklearn.naive_bayes.
  • Vytvoř instanci klasifikátoru MultinomialNB s názvem nb_classifier.
  • Natrénuj klasifikátor na trénovacích datech.
  • Vypočítej předpovězené štítky pro testovací data.
  • Vypočítej a vypiš skóre přesnosti klasifikátoru.
  • Vypočítej matici záměn. Pro lepší čitelnost zadej pojmenovaný argument labels=['FAKE', 'REAL'].