1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. PySpark入門

Connected

अभ्यास

DataFrame で SQL を実行する

PySpark では、SQL クエリを使って DataFrame を簡単に操作できます。SparkSession の .sql() メソッドを使うと、アプリケーションからプログラム的に SQL クエリを実行し、その結果を別の DataFrame として受け取れます。この演習では、以前に作成した DataFrame を一時テーブルとして登録し、その一時テーブルから人名を選択するクエリを作成して、結果を新しい DataFrame に代入します。

ワークスペースには、すでに SparkSession の spark と DataFrame の df が用意されています。

निर्देश

100 XP
  • DataFrame df から "people" という名前の一時テーブルを作成します。
  • 一時テーブル people から人名を選択するクエリを作成します。
  • Spark のクエリ結果を people_df_names という新しい DataFrame に代入します。
  • people_df_names DataFrame から先頭10件の人名を表示します。