1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

Exercise

상품 리뷰의 언어 감지

non_english_reviews라는 작은 데이터셋에서 언어 감지를 연습해 보겠습니다. 이 데이터는 Amazon 상품 리뷰 중 영어가 아닌 리뷰의 샘플입니다.

데이터셋의 각 행을 순회하면서 언어를 감지해 비어 있는 리스트에 추가하세요. 리스트는 정제해서, 일반적인 출력인 en:0.9987654 대신 리뷰의 언어만 포함하도록 해야 합니다. 예를 들어 영어라면 'en'만 남기세요. 언어 감지 함수는 둘 이상의 언어를 반환할 수 있으며, 반환 리스트의 첫 번째 항목이 가장 가능성이 높은 후보임을 기억하세요. 마지막으로, 이 리스트를 새 열에 할당합니다.

로직은 슬라이드와 이전 연습 문제에서 사용한 것과 동일하지만, 함수 적용 대상이 리스트가 아니라 데이터셋이라는 점만 다릅니다.

Инструкции

100 XP
  • non_english_reviews 데이터셋의 행을 반복(iterate)하세요.
  • 루프 내부에서 데이터셋의 두 번째 열의 언어를 감지하세요.
  • 리스트 컴프리헨션 표현식 안에서 : 기준으로 문자열을 분할하여 정제하세요.
  • 마지막으로, 정제된 리스트를 새 열에 할당하세요.