최적의 L1 패널티 계수 식별하기

이제 L1 정규화를 위한 C 파라미터를 튜닝해, 모델 복잡도를 낮추면서도 성능 지표를 잘 유지하는 값을 찾아볼 거예요. 가능한 C 값들에 대해 for 루프를 실행하면서 각 값으로 로지스틱 회귀 모델을 만들고, 성능 지표를 계산합니다.

가능한 값이 담긴 리스트 C가 준비되어 있어요. 배열 l1_metrics는 3개 열로 구성되어 있으며, 첫 번째 열은 C 값, 다음 두 열은 0이 아닌 계수의 개수와 모델의 재현율(recall) 점수를 위한 자리입니다. 스케일링된 피처와 타깃 변수는 학습용 train_X, train_Y, 테스트용 test_X, test_Y로 로드되어 있습니다.

numpy와 pandas는 각각 np, pd로 임포트되어 있고, sklearn의 recall_score 함수도 불러와져 있어요.