MulaiMulai sekarang secara gratis

Apa itu logistic regression?

Model yang akan Anda latih di bab ini disebut logistic regression. Model ini sangat mirip dengan linear regression, tetapi alih-alih memprediksi variabel numerik, model ini memprediksi probabilitas (antara 0 dan 1) dari suatu kejadian.

Untuk menggunakannya sebagai algoritma klasifikasi, yang perlu Anda lakukan hanyalah menetapkan titik batas pada probabilitas tersebut. Jika probabilitas yang diprediksi berada di atas titik batas, Anda mengklasifikasikan pengamatan tersebut sebagai "ya" (dalam hal ini, penerbangan terlambat); jika di bawah, Anda mengklasifikasikannya sebagai "tidak"!

Anda akan menyetel model ini dengan menguji berbagai nilai untuk beberapa hyperparameter. Hyperparameter adalah nilai dalam model yang tidak diestimasi dari data, melainkan ditentukan oleh pengguna untuk memaksimalkan kinerja. Untuk kursus ini, Anda tidak perlu memahami matematika di balik semua nilai tersebut—yang penting adalah Anda akan mencoba beberapa pilihan berbeda dan memilih yang terbaik.

Mengapa Anda memberikan hyperparameter?

Latihan ini adalah bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga