1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. PySpark入門

Connected

Bài tập

スキーマの記述

これまでに複数の方法でスキーマを読み込みました。ここではスキーマを直接定義してみましょう。次のデータ辞書を使います。

Variable Description
age 個人の年齢
education_num 学位に基づく教育年数
marital_status 配偶関係の状況
occupation 職業
income 所得(カテゴリ変数)

Hướng dẫn

100 XP
  • データスキーマを指定します。列名(age、education_num、marital_status、occupation、income)と列のデータ型を定義し、sep= 引数にはカンマを設定します。
  • カンマ区切りのファイル adult_reduced_100.csv からデータを読み込みます。
  • 作成されたDataFrameのスキーマを出力します。