1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 정제하기

Connected

연습 문제

설명적인 내용 유지하기

샌프란시스코 공항의 여행자 경험을 더 잘 파악하기 위해, 품질 보증 부서는 가능한 모든 범주에서 최악의 점수를 준 모든 여행자에게 정성 설문지를 보냈습니다. 이 설문의 목적은 여행자들이 공항에 관해 공통적으로 무엇을 말하는지 패턴을 파악하는 것입니다.

응답은 survey_response 열에 저장되어 있어요. 자세히 살펴보니, 몇몇 답변은 내용 없이 가능한 가장 짧은 문자 수만 채운 경우가 있었습니다. 이번 연습에서는 문자 수가 40자보다 큰 응답만 분리하고, assert 문을 사용해 새 DataFrame에 들어 있는 응답이 40자 이상인지 확인해 볼 거예요.

airlines DataFrame은 이미 작업 환경에 있으며, pandas는 pd로 임포트되어 있습니다.

지침

100 XP
  • airlines DataFrame을 사용해, survey_response 열 각 값의 길이를 .str.len()으로 계산해 resp_length에 저장하세요.
  • resp_length가 40보다 큰 airlines의 행만 분리하세요.
  • 이제 airlines_survey에서 가장 작은 survey_response 길이가 40보다 큰지 assert로 확인하세요.