1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Numărarea cuvintelor (II)

Odată ce vectorizatorul a fost antrenat pe date, poate fi folosit pentru a transforma textul într-un array care reprezintă numărul de apariții ale cuvintelor. Acest array va avea câte un rând pentru fiecare bloc de text și câte o coloană pentru fiecare dintre caracteristicile generate de vectorizator, pe care le-ai observat în exercițiul anterior.

Vectorizatorul pe care l-ai antrenat în exercițiul anterior (cv) este disponibil în spațiul tău de lucru.

Instrucțiuni 1/2

undefined XP
    1
    2
  • Aplică vectorizatorul pe coloana text_clean.
  • Convertește acest array transformat (sparse) într-un array numpy cu numărătorile de apariții.