1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Spark SQL 입문

Connected

연습 문제

데이터 분할하기

df_examples라는 데이터프레임이 제공되어 있으며, endword: string, features: vector, outvec: vector, label: int 열을 포함합니다. 이 데이터를 학습용과 테스트용으로 분할한 뒤, 분류기를 학습하고 평가하는 데 사용할 거예요.

지침

100 XP
  • 예제를 80/20 비율로 학습용과 테스트용으로 분할하세요.
  • 학습 예제 개수를 출력하세요.
  • 테스트 예제 개수를 출력하세요.