1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Din text în DataFrame

Acum că ai generat aceste caracteristici bazate pe numărătoare într-un array, va trebui să le reformatezi pentru a putea fi combinate cu restul setului de date. Acest lucru se poate realiza prin conversia array-ului într-un DataFrame pandas, folosind numele caracteristicilor găsite anterior ca nume de coloane, apoi concatenând rezultatul cu DataFrame-ul original.

Array-ul numpy (cv_array) și vectorizatorul (cv) pe care le-ai antrenat în exercițiul anterior sunt disponibile în spațiul tău de lucru.

Instrucțiuni

100 XP
  • Creează un DataFrame cv_df care să conțină cv_array ca valori și numele caracteristicilor ca nume de coloane.
  • Adaugă prefixul Counts_ la numele coloanelor, pentru o identificare mai ușoară.
  • Concatenează acest DataFrame (cv_df) cu DataFrame-ul original (speech_df) pe coloane.