1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Găsirea celor mai frecvente cuvinte

După ce ai creat caracteristicile, este întotdeauna recomandat să le inspectezi pentru a te asigura că sunt conforme cu așteptările tale. Astfel poți depista erorile din timp și poți decide ce pași suplimentari de inginerie a caracteristicilor sunt necesari.

Vectorizatorul (cv) pe care l-ai antrenat în exercițiul anterior și matricea rară cu numărătorile de cuvinte (cv_trigram) sunt disponibile în spațiul tău de lucru.

Instrucțiuni

100 XP
  • Creează un DataFrame cu caracteristicile (numărătorile de cuvinte).
  • Adaugă numărul de apariții ale cuvintelor și afișează primele 5 cuvinte cu cele mai multe apariții.