1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Analýza sentimentu s GBM

Teď použijeme GradientBoostingClassifier z scikit-learn na datasetu reviews, abychom na základě textu recenze předpověděli její sentiment.

Jako vstup modelu nebudeme předávat surový text. Následující předzpracování dat už bylo provedeno za tebe:

  1. Odebrání recenzí s chybějícími hodnotami.
  2. Výběr dat z 5 nejpopulárnějších aplikací.
  3. Náhodný výběr 500 recenzí.
  4. Odstranění „stop slov" z recenzí.
  5. Převod recenzí na matici, kde každý příznak reprezentuje četnost daného slova v recenzi.

Chceš lépe porozumět dolování textu? Podívej se na kurz Introduction to Natural Language Processing in Python!

Pokyny

100 XP
  • Sestav GradientBoostingClassifier se 100 estimátory a hodnotou learning rate 0.1.
  • Vypočítej predikce na testovací sadě.
  • Vyhodnoť model výpočtem přesnosti.
  • Vypočítej a vypiš matici záměn.