最適なデータセットを選ぶ

それでは、ufo データセットから不要な特徴量を取り除きます。country 列は country_enc としてエンコード済みなので、country_enc を残し、位置情報に関する他の列である city、country、lat、long、state を削除できます。

month と year 列は作成済みなので、もとの date と recorded 列は不要です。また、seconds 列は seconds_log として標準化したため、seconds と minutes を削除できます。

desc はベクトル化済みなので、こちらも削除します。現時点では type は残しておきます。