1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 배우는 Unsupervised Learning

Connected

演習

Wikipedia 문서의 NMF 특징

이제 이전 연습 문제에서 만든 NMF 특징을 탐색해 보겠습니다. 이전 연습 문제의 풀이가 미리 로드되어 있으므로 배열 nmf_features를 사용할 수 있어요. 각 Wikipedia 문서의 제목을 담은 리스트 titles도 제공됩니다.

특징을 살펴보면 두 배우 모두에서 NMF 특징 3의 값이 압도적으로 가장 크다는 것을 확인할 수 있어요. 이는 두 문서가 주로 세 번째 NMF 컴포넌트로 재구성된다는 뜻입니다. 다음 영상에서 그 이유를 보게 될 텐데요: NMF 컴포넌트는 주제(예: 연기)를 나타냅니다!

指示

100 XP
  • pandas를 pd로 임포트하세요.
  • pd.DataFrame()을 사용해 nmf_features로부터 DataFrame df를 만드세요. 인덱스는 index=titles로 설정하세요.
  • df의 .loc[] 접근자를 사용해 제목이 'Anne Hathaway'인 행을 선택하고, 결과를 출력하세요. 이것이 배우 Anne Hathaway에 대한 문서의 NMF 특징입니다.
  • 같은 작업을 'Denzel Washington'(또 다른 배우)에도 반복하세요.