1. Learn
  2. /
  3. Cursuri
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

exercițiu

Vectorizarea textului

Vei transforma acum coloana title din setul de date volunteer într-un vector de text, pe care îl vei folosi într-o sarcină de predicție în exercițiul următor.

Instrucțiuni

100 XP
  • Stochează coloana volunteer["title"] într-o variabilă numită title_text.
  • Instanțiază un TfidfVectorizer cu numele tfidf_vec.
  • Transformă textul din title_text într-un vector tf-idf folosind tfidf_vec.