1. Lära sig
  2. /
  3. Courses
  4. /
  5. PySpark로 하는 Machine Learning

Connected

exercise

계수 해석하기

출발 공항 org에는 여덟 가지 값(ORD, SFO, JFK, LGA, SMF, SJC, TUS, OGG)이 있으며, 이는 org_dummy에서 일곱 개 더미 변수로 원-핫 인코딩되어 있어요.

km와 org_dummy 값은 희소 표현을 사용해 여덟 개 열을 가진 features로 결합되었어요. features의 열 인덱스는 다음과 같아요.

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 — SJC
  • 7 — TUS

OGG는 출발 공항 범주의 기준(reference) 수준이므로 이 목록에 나타나지 않음을 유의하세요.

LinearRegression 인스턴스는 regression에 준비되어 있어요. 이 연습에서는 모델을 해석하기 위해 intercept와 coefficients 속성을 사용할 거예요.

coefficients 속성은 리스트이며, 첫 번째 원소는 비행 거리 변화에 따른 비행 시간의 변화를 나타내요.

Instruktioner

100 XP
  • 평균 속도를 km/시로 구하세요. 모델이 더 정교해졌으므로 앞에서 구한 값과는 달라질 수 있어요.
  • OGG에서의 평균 지상 대기 시간은 얼마인가요?
  • JFK에서의 평균 지상 대기 시간은 얼마인가요?
  • LGA에서의 평균 지상 대기 시간은 얼마인가요?