or
Latihan ini merupakan bagian dari kursus
Pada bab ini kita memperkenalkan konsep regresi dari sudut pandang machine learning. Kami akan menyajikan metode regresi fundamental: regresi linear. Kami akan menunjukkan cara menyesuaikan model regresi linear dan membuat prediksi dari model tersebut.
Setelah mempelajari cara menyesuaikan model regresi linear dasar, kita akan mempelajari cara mengevaluasi kinerja model. Kita akan meninjau evaluasi model secara grafis, dan melihat dua metrik dasar untuk model regresi. Kita juga akan mempelajari cara melatih model yang akan bekerja baik di dunia nyata, bukan hanya pada data pelatihan. Meskipun kita akan mendemonstrasikan teknik-teknik ini menggunakan regresi linear, semua konsep ini berlaku untuk model yang dipasang dengan algoritma regresi apa pun.
Latihan Saat Ini
Sebelum melanjutkan ke teknik regresi yang lebih canggih, kita akan melihat beberapa isu pemodelan lainnya: pemodelan dengan masukan kategorikal, interaksi antar variabel, dan kapan Anda mungkin mempertimbangkan untuk mentransformasikan masukan dan keluaran sebelum pemodelan. Meskipun teknik regresi yang lebih canggih mengelola beberapa isu ini secara otomatis, penting untuk menyadarinya agar Anda memahami metode mana yang paling baik menangani berbagai isu — dan isu mana yang masih harus Anda kelola sendiri.
Setelah menguasai model linear, kita akan mulai melihat teknik untuk memodelkan situasi yang tidak memenuhi asumsi linearitas. Ini mencakup memprediksi probabilitas dan frekuensi (nilai yang dibatasi antara 0 dan 1); memprediksi cacah (nilai bilangan bulat tak negatif, dan laju terkait); serta respons yang memiliki hubungan nonlinier tetapi aditif terhadap masukan. Algoritme ini merupakan variasi dari model linear standar.
Pada bab ini kita akan melihat algoritme pemodelan yang tidak mengasumsikan linearitas atau aditivitas, dan yang dapat mempelajari jenis interaksi terbatas di antara variabel masukan. Algoritme ini adalah metode berbasis pohon yang bekerja dengan menggabungkan ansambel pohon keputusan yang dipelajari dari data pelatihan.