1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Wyszukiwanie najczęściej występujących słów

Po utworzeniu cech warto je dokładnie przejrzeć i upewnić się, że wyglądają zgodnie z oczekiwaniami. Dzięki temu można wcześnie wykryć błędy, a także zdecydować, jakie dalsze kroki inżynierii cech będą potrzebne.

Wektoryzator (cv) dopasowany w poprzednim ćwiczeniu oraz rzadka macierz z liczbą wystąpień słów (cv_trigram) są dostępne w twoim środowisku roboczym.

Instrukcje

100 XP
  • Utwórz DataFrame zawierający cechy (liczby wystąpień słów).
  • Zsumuj liczby wystąpień słów i wyświetl 5 najczęściej pojawiających się słów.