1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 음성 언어 처리

Connected

exercise

전사된 전화 통화 데이터 정리하기

이제 텍스트 분류기를 만들 준비가 거의 되었어요. 하지만 지금은 전사된 텍스트 데이터가 두 개의 리스트, pre_purchase_text와 post_purchase_text에만 담겨 있어요.

텍스트 분류기 구축과 이후 활용을 위해 더 잘 정리하려면, 이 데이터를 하나의 pandas DataFrame으로 합치겠습니다.

먼저 pandas를 pd로 임포트한 뒤, pd.DataFrame()을 사용해 구매 후 데이터프레임 post_purchase_df를 만들 거예요.

pd.DataFrame()에 "label" 키에는 "post_purchase" 값을, "text" 키에는 post_purchase_text 리스트 값을 담은 딕셔너리를 전달하세요.

pre_purchase_df도 같은 방식으로 만드는데, 이때는 pre_purchase_text를 사용하면 됩니다.

모든 데이터를 한곳에 모으기 위해 pd.concat()을 사용해 사전 및 사후 구매 DataFrame을 전달해 합치겠습니다.

Instruktioner

100 XP
  • post_purchase_text 리스트를 사용해 post_purchase_df를 생성하세요.
  • pre_purchase_text 리스트를 사용해 pre_purchase_df를 생성하세요.
  • pd.concat()으로 두 DataFrame을 결합하세요.