1. 학습
  2. /
  3. 강의
  4. /
  5. R 사용자용 Python

Connected

연습 문제

더미 변수

이 강의의 마지막 연습 문제에서는 숫자가 아닌 열을 더미 인코딩하여 모델링을 위한 데이터를 준비해 보겠습니다. 예를 들어 성별 열에 'Male'와 'Female' 값이 있다면, 각 관측치가 'Male'인지 'Female'인지 알려 주는 별도의 열이 필요해요. 이렇게 더미 변수를 만드는 과정을 원-핫 인코딩(one-hot encoding)이라고도 합니다.

pandas의 get_dummies() 함수를 사용하면 숫자가 아닌 열을 더미 변수로 변환할 수 있어요.

df_new = pd.get_dummies(df)

무슨 일이 일어나는지 쉽게 볼 수 있도록 flights DataFrame에서 일부만 추려 flights_sub를 만들어 두었습니다.

지침 1/3

undefined XP
    1
    2
    3

flights_sub의 처음 5개 행을 출력하세요.