クラスタを可視化する

最適な k 値（k=16）で k-means モデルを学習し、クラスタセンター（セントロイド）を生成しました。最後のこの演習では、クラスタとセントロイドを重ねて可視化します。これによりクラスタリングの出来具合が分かります（理想的には、クラスタ同士は明確に分かれ、セントロイドはそれぞれのクラスタの中心に位置します）。

これを行うために、まず rdd_split_int RDD を Spark DataFrame に変換し、さらにプロットに使える Pandas DataFrame に変換します。同様に、cluster_centers も Pandas DataFrame に変換します。2つの DataFrame が用意できたら、Matplotlib を使って散布図を作成します。

SparkContext sc、変数 rdd_split_int と cluster_centers、およびパッケージ matplotlib.pyplot（plt としてインポート済み）はワークスペースで利用できます。