1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. PySpark入門

Connected

अभ्यास

総まとめ I

これまでに PySpark の基礎をしっかり身につけ、コアコンポーネントを理解し、Spark SQL、DataFrame、そして高度な処理を使った実践にも取り組んできました。ここで、学んだ内容を総合的に活用していきます。次の2つの演習では、SparkSession を作成し、DataFrame を用意してキャッシュし、分析を実行して、その結果を説明します!

निर्देश

100 XP
  • pyspark.sql から SparkSession をインポートします。
  • SparkSession.builder.getOrCreate() を使って、final_spark という名前の新しい SparkSession を作成します。
  • my_spark をコンソールに表示して、SparkSession であることを確認します。
  • 事前に読み込まれているスキーマと列定義から新しい DataFrame を作成します。