1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Spark SQL bằng Python

Connected

Bài tập

Tách và explode một cột văn bản

Đã cung cấp một dataframe clauses_df với 100 hàng. Nó có một cột clause và một id hàng. Mỗi clause là một chuỗi chứa một hoặc nhiều từ, được phân tách bằng dấu cách.

Hướng dẫn

100 XP
  • Tách cột clause thành một cột tên words, chứa một mảng các từ riêng lẻ.
  • Explode cột words thành một cột tên word.
  • Đếm số lượng hàng thu được.