1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 정제하기

Connected

연습 문제

일관성 찾기

이번 연습 문제와 이 장 전반에서 사용할 airlines DataFrame에는 항공사 고객이 샌프란시스코 공항에 대해 응답한 설문 결과가 들어 있습니다.

이 DataFrame에는 항공사, 목적지, 대기 시간 같은 항공편 메타데이터와 더불어 청결도, 안전, 만족도에 관한 핵심 질문의 답변이 포함되어 있어요. 설문 열에 대해 가능한 모든 올바른 값을 담은 또 다른 DataFrame categories도 준비되어 있습니다.

이번 연습에서는 두 DataFrame을 함께 사용해 설문 응답 중 값이 일관되지 않은 항목을 찾아 제거합니다. 이는 비디오 연습에서 본 것처럼 두 DataFrame에 대해 바깥 조인과 안쪽 조인을 수행하는 것과 같습니다. pandas 패키지는 pd로 임포트되어 있고, airlines와 categories DataFrame은 이미 환경에 로드되어 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • categories DataFrame을 출력하고, 설문 열의 가능한 모든 올바른 범주를 자세히 확인하세요.
  • .unique() 메서드를 사용해 airlines의 설문 열에서 고유 값을 출력하세요.