1. Nauka
  2. /
  3. Kursy
  4. /
  5. Metody zespołowe w Pythonie

Connected

ćwiczenie

Analiza sentymentu z GBM

Użyjmy teraz GradientBoostingClassifier z biblioteki scikit-learn na zbiorze danych reviews, aby przewidzieć sentyment recenzji na podstawie jej treści.

Nie będziemy przekazywać surowego tekstu bezpośrednio do modelu. Poniższe kroki przetwarzania wstępnego zostały już wykonane:

  1. Usunięcie recenzji z brakującymi wartościami.
  2. Wybranie danych z 5 najpopularniejszych aplikacji.
  3. Wylosowanie próbki 500 recenzji.
  4. Usunięcie „stop words" z recenzji.
  5. Przekształcenie recenzji w macierz, w której każda cecha reprezentuje częstotliwość występowania danego słowa w recenzji.

Chcesz lepiej zrozumieć przetwarzanie tekstu? Zajrzyj do kursu Introduction to Natural Language Processing in Python!

Instrukcje

100 XP
  • Zbuduj GradientBoostingClassifier ze 100 estymatorami i współczynnikiem uczenia 0.1.
  • Oblicz predykcje na zbiorze testowym.
  • Wyznacz dokładność, aby ocenić model.
  • Oblicz i wyświetl macierz pomyłek.