1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

अभ्यास

스페인어 리뷰 어간 추출하기

이전 장에서 Amazon 상품 리뷰의 언어를 판별하기 위해 언어 감지 패키지를 사용했던 것을 기억하시나요? 이번 연습에서는 먼저 non_english_reviews의 언어를 감지합니다. 리뷰는 여러 언어로 되어 있지만, 이 중 스페인어인 리뷰만 선택할 거예요. 개념이 잘 기억나지 않으면 외국어 감지에 대해 설명한 영상을 다시 보셔도 됩니다.

두 번째 단계에서는 스페인어 리뷰에서 단어 토큰을 만든 뒤, 스페인어용 SnowBall stemmer를 사용해 어간 추출을 수행합니다. 안타깝지만 언어 감지 패키지가 완벽하지는 않습니다. 따라서 가끔 감지된 언어가 정확하지 않을 수 있습니다.

निर्देश 1/2

undefined XP
    1
    2
  • langdetect 패키지를 임포트하세요.
  • len() 메서드와 range() 함수를 사용해 non_english_reviews의 행을 반복(iterate)하세요.
  • for 루프에서 각 리뷰의 언어를 감지하기 위해 detect_langs()를 사용하세요.