1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Caracteristici generale ale textului

După ce textul a fost curățat și standardizat, poți începe să creezi caracteristici din date. Cele mai fundamentale informații pe care le poți calcula despre un text liber sunt dimensiunea sa, cum ar fi lungimea și numărul de cuvinte. În acest exercițiu (și în restul acestui capitol), te vei concentra pe coloana de text curățat/transformat (text_clean) pe care ai creat-o în exercițiul anterior.

Instrucțiuni

100 XP
  • Înregistrează lungimea în caractere a fiecărui discurs în coloana char_count.
  • Înregistrează numărul de cuvinte al fiecărui discurs în coloana word_count.
  • Înregistrează lungimea medie a cuvintelor din fiecare discurs în coloana avg_word_length.