1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 사기 탐지

Connected

연습 문제

데이터프레임으로 단어 검색하기

이번 연습에서는 Enron 직원들의 이메일이 담긴 텍스트 데이터를 다룹니다. Enron 스캔들은 유명한 금융 사기 사건이에요. Enron 직원들은 회사의 불안정한 재무 상태를 숨겨 주가를 인위적으로 높였고, 그 사이에 자신들의 스톡옵션을 처분했습니다. 진실이 드러났을 때 Enron 투자자들은 큰 손실을 입었죠. 우리의 목표는 "sell enron stock"처럼 특정 단어를 언급한 모든 이메일을 찾는 것입니다.

데이터프레임에서 문자열 연산을 사용하면, 지저분한 이메일 데이터도 쉽게 훑어보고 특정 단어가 등장했는지에 따라 플래그를 만들 수 있어요. Enron 이메일 데이터는 df라는 데이터프레임에 담겨 있으니, 의심스러운 용어를 찾아봅시다. 시작하기 전에 콘솔에서 df를 자유롭게 살펴보셔도 됩니다.

지침 1/2

undefined XP
    1
    2
  • 콘솔에서 df의 head를 확인하고, 'sell enron stock'을 언급한 이메일이 있는지 찾아보세요.