1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

Boolean 열 설정

데이터셋에는 Boolean 값으로 모델링하는 것이 가장 정확한 열이 있을 수 있어요. 하지만 pandas는 기본적으로 이런 열을 float로 불러오는 경우가 많습니다. 기본을 Boolean으로 두면 NA 값을 True로 바꾸는 등 원치 않는 효과가 생길 수 있기 때문이에요.

fcc_survey_subset.xlsx에는 문자열 ID 열과 재정적 스트레스를 나타내는 여러 True/False 열이 들어 있어요. ID가 아닌 열 중 NA 값이 전혀 없는 열을 확인한 뒤, 그런 열을 Boolean으로 설정할 수 있도록 read_excel()의 dtype 인자를 사용해 불러오세요.

pandas는 pd로 불러와져 있어요.

지침 1/2

undefined XP
    1
    2
  • survey_data의 각 열에서 isna()와 sum()으로 NA 개수를 세세요. ID.x를 제외하고 NA가 0개인 열이 있는지 확인하세요.