1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Trénování a testování modelu pro detekci fake news pomocí TfidfVectorizeru

Teď, když jsi vyhodnotil/a model pomocí CountVectorizeru, uděláš totéž s TfidfVectorizerm a modelem Naive Bayes.

Trénovací a testovací sady jsou připravené a hodnoty tfidf_vectorizer, tfidf_train a tfidf_test jsou vypočítané. Navíc jsou importované MultinomialNB ze sklearn.naive_bayes a metrics ze sklearn.

Pokyny

100 XP
  • Vytvoř instanci klasifikátoru MultinomialNB s názvem nb_classifier.
  • Natrénuj klasifikátor na trénovacích datech.
  • Vypočítej předpovězené štítky pro testovací data.
  • Vypočítej a vypiš skóre přesnosti klasifikátoru.
  • Vypočítej matici záměn. Stejně jako v předchozím cvičení zadej pojmenovaný argument labels=['FAKE', 'REAL'], aby byla výsledná matice záměn přehlednější.