1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Eksploracja wektorów tekstowych, część 1

Rozbudujemy teraz metodę eksploracji wektorów tekstowych, którą poznałeś wcześniej – tym razem na wektorach tf/idf kolumny title ze zbioru danych volunteer. W tej pierwszej części uzupełnimy funkcję omówioną na slajdach tak, aby zwracała listę liczb. W następnym ćwiczeniu napiszemy kolejną funkcję, która zbierze najważniejsze słowa ze wszystkich dokumentów, wyodrębni je, a następnie użyje tej listy do przefiltrowania wektora text_tfidf.

Instrukcje

100 XP
  • Dodaj parametry original_vocab dla tfidf_vec.vocabulary_ oraz top_n.
  • Wywołaj pd.Series() na spakowanym słowniku – ułatwi to dalsze operacje.
  • Użyj funkcji .sort_values(), aby posortować serię, a następnie ogranicz indeks do top_n słów.
  • Wywołaj funkcję, ustawiając original_vocab=tfidf_vec.vocabulary_, vector_index=8, aby pobrać 9. wiersz, oraz top_n=3, aby uzyskać 3 najwyżej ważone słowa.