ロジスティック回帰によるベースライン分類器

直近の2つのレッスンでは、Machine Learningの面接において特徴量選択がいかに重要かを学びました。面接でよく問われるもう一つのテーマが特徴量エンジニアリングで、モデル性能の向上にどう役立つかという点です。

この演習では、Chapter 1のloan_dataデータセットに対して新しい特徴量を作成し、特徴量エンジニアリングの前後でロジスティック回帰モデルの正解率を比較します。テストラベルと、目的変数Loan Statusの予測値を比較して評価します。

必要なパッケージはすべてインポート済みです：matplotlib.pyplotをplt、seabornをsns、sklearn.linear_modelのLogisticRegression、sklearn.model_selectionのtrain_test_split、そしてsklearn.metricsのaccuracy_score。