1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

演習

parquet ファイルからデータフレームを読み込む

作業スペースには sherlock_sentences.parquet というデータフレームファイルがあります。 このデータフレームの各行には単一の節が含まれています。 各節は、ピリオドや引用符など、文や文の一部を示す自然言語の区切り文字によって他の節と区切られた単語の並びです。 あなたのミッションは(受けて立つなら)、このファイルを読み込むことです。

指示

100 XP
  • sherlock_sentences.parquet を読み込みます。
  • 「id > 70」でフィルタし、先頭5行を表示します。