1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

Exercise

텍스트를 DataFrame으로

이제 카운트 기반 특성을 배열로 만들었으니, 나머지 데이터셋과 결합할 수 있도록 형식을 바꿔야 해요. 이를 위해 배열을 pandas DataFrame으로 변환하고, 앞에서 얻은 특성 이름을 열 이름으로 설정한 뒤, 원래 DataFrame과 이어 붙이면 됩니다.

이전 연습 문제에서 만든 numpy 배열(cv_array)과 벡터라이저(cv)가 작업 공간에 준비되어 있어요.

Instructions

100 XP
  • cv_array를 값으로, 특성 이름을 열 이름으로 사용하여 DataFrame cv_df를 생성하세요.
  • 식별하기 쉽게 열 이름 앞에 Counts_ 접두사를 추가하세요.
  • 이 DataFrame(cv_df)을 원래 DataFrame(speech_df)과 열 기준으로 이어 붙이세요.