Model mainan kedua
Dalam latihan ini, Anda akan membangun classifier lain menggunakan logistic regression pada himpunan data gambar. Setiap gambar merepresentasikan angka 0 sampai 9. Tujuannya adalah mengklasifikasikan setiap gambar sebagai sebuah angka—misalnya, 7 atau 9. Fitur yang digunakan adalah nilai piksel spesifik dengan rentang 0–16 yang membentuk gambar tersebut. Alih-alih mengevaluasi akurasi secara manual, Anda akan mengevaluasi akurasi model menggunakan accuracy_score() dari sklearn.
Data contoh gambar dimuat sebagai image_data bersama sklearn dan pandas sebagai pd. LogisticRegression tersedia melalui sklearn.linear_model.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Dapatkan jumlah baris
Xuntuk menentukan indeks pemisahan data pelatihan dan pengujian. - Buat classifier logistic regression.
- Buat prediksi menggunakan classifier dan evaluasi akurasinya dengan
accuracy_score()darisklearn.metrics.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define X and y
X = image_data.data
y = image_data.target
# Define training and testing
split = int(0.7 * ____(X))
X_train, X_test, y_train, y_test = \
X[:split], X[split:], y[:split], y[split:]
# Create logistic regression classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(X_train, y_train).____(X_test)
print(____(y_test, y_pred))