1. 학습
  2. /
  3. 강의
  4. /
  5. Python 함수 입문

Connected

연습 문제

모아 보기 (1)

이전 연습 문제에서 직접 함수를 작성해 보셨습니다. 함수 정의에 매개변수를 추가하는 방법, 튜플로 하나 이상의 값을 반환하는 방법, 그리고 정의한 함수를 호출하는 법을 배웠어요.

이번 연습과 다음 연습에서는 이 모든 개념을 한데 모아 간단한 데이터 사이언스 문제에 적용해 보겠습니다. 데이터셋을 불러오고, 데이터에서 간단한 인사이트를 추출하는 기능을 만들어 볼 거예요.

이번 과제의 목표는 데이터셋을 DataFrame으로 불러오는 방법을 떠올리는 것입니다. 데이터셋에는 Twitter 데이터가 들어 있으며, 열의 항목을 순회해 언어 이름을 키로, 해당 언어의 트윗 수를 값으로 하는 딕셔너리를 만들게 됩니다. 파일 tweets.csv는 현재 디렉터리에 있습니다.

주의: 이 데이터는 실제 Twitter 데이터이므로, 욕설이나 불쾌감을 줄 수 있는 내용이 포함되어 있을 수 있습니다(이번 연습과, 실제 Twitter 데이터를 사용하는 이후 연습 모두에 해당합니다).

지침

100 XP
  • pandas 패키지를 별칭 pd로 임포트하세요.
  • pandas 함수 read_csv()를 사용해 파일 'tweets.csv'를 임포트하세요. 생성된 DataFrame을 df에 할당하세요.
  • DataFrame df의 'lang' 열인 col을 순회하도록 for 루프를 완성하세요.
  • for 루프 안의 if-else 문 본문을 완성하세요: 키가 딕셔너리 langs_count에 있으면 해당 키의 값을 1 증가시키고, 그렇지 않으면 키를 langs_count에 추가하고 값을 1로 설정하세요. 루프 변수 entry를 사용하세요.