1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Vylepšení modelu

V tomto cvičení otestuješ několik různých hodnot alpha s pomocí vektorů Tfidf a zjistíš, jestli existuje lepší kombinace.

Trénovací a testovací sady jsou připravené a tfidf_vectorizer, tfidf_train i tfidf_test jsou již vypočítané.

Pokyny

100 XP
  • Vytvoř seznam hodnot alpha pomocí np.arange(). Hodnoty by měly být v rozsahu od 0 do 1 s krokem 0.1.
  • Vytvoř funkci train_and_predict(), která přijímá jeden argument: alpha. Funkce by měla:
    • Instanciovat klasifikátor MultinomialNB s parametrem alpha=alpha.
    • Natrénovat ho na trénovacích datech.
    • Vypočítat predikce na testovacích datech.
    • Vypočítat a vrátit skóre přesnosti.
  • Pomocí cyklu for vypiš alpha, score a mezi nimi prázdný řádek. Pro výpočet score použij svou funkci train_and_predict(). Mění se skóre spolu s hodnotou alpha? Jaká hodnota alpha je nejlepší?