단어 벡터 투영

단어 벡터를 산점도로 시각화하면 어휘가 어떻게 군집을 이루는지 이해하는 데 도움이 됩니다. 벡터를 시각화하려면 2차원 공간으로 투영해야 해요. 이를 위해 Principal Component Analysis (PCA)로 두 개의 주성분을 추출해 벡터를 투영할 수 있습니다.

이 연습 문제에서는 sklearn의 PCA 라이브러리를 사용해 단어 벡터를 추출하고 2차원 공간으로 투영하는 방법을 연습해 보겠습니다.

words 리스트에 저장된 짧은 단어 목록과 en_core_web_md 모델이 제공됩니다. 모델은 nlp로 로드되어 있어요. 필요한 라이브러리와 패키지(PCA, numpy는 np로)가 모두 이미 임포트되어 있습니다.