1. Tujuan [back]
1. Memahami algoritma machine learning model linear
2. Alat dan Bahan [back]
Alat yang digunakan pada pembelajaran ini adalah software Matlab
3. Dasar Teori [back]
MATLAB merupakan bahasa pemrograman tingkat tinggi yang dikembangkan oleh MathWorks dan dikhususkan untuk komputasi numerik, visualisasi, dan pemrograman.
MODEL LINEAR
1. Pengertian
Model linear adalah
kombinasi linear dari fungs nonlinear dari variable input.
Persamaan linear
sederhana :
Dimana yi adalah nilai sebenarnya dan yi~ adalah nilai perkiraan.
2. Binary classification
Binary classification
adalah suatu metode untuk menklasifikasikan data menjadi 2 kelas.
F(x) > threshold maka masuk ke kelas 1, F(x) < threshold maka masuk ke kelas 2. Threshold ini menjadi pembatas antara 2 kela (boundary decision).
3. Log-Linear Binary Classification
Digunakan untuk
mengetahui besar peluang data tergolong pada suatu kelas.
Fungsi diatas juga dapat
diyatakan dalam fungsi logistik
Terdapat 2 jenis
multiclass classification, yaitu :
a.
One versus one
Pada teknik one versus
one, kita membuat sejumlah kombinasi pasangan kelas. Kemudian tiap model mengklasifikasikan
input ke dalam satu dari 2 kelas. Pemilihan kelas klasifikasi didasarkan pada
kelas yang sering muncul.
yi = 1 |
yi = -1 |
Hipotesis |
Kelas 1 |
kelas 2 |
|
Kelas 1 |
kelas 3 |
|
Kelas 1 |
kelas 4 |
|
Kelas 2 |
kelas 3 |
|
Kelas 2 |
Kelas 4 |
|
Kelas 3 |
Kelas 4 |
a.
One versus all
Model pertama mengklasifikasikan
input sebagai kelas pertama atau bukan kelas pertama. Setelah itu, dilanjutkan
ke model kedua mengklasifikasikan input sebagai kelas kedua atau bukan kelas
kedua, dan seterusnya.
Pada Multi label
Classification mendefinisikan suatu data bisa saja tidak hanya dikelompokkan ke
dalam 1 kelas, tetapi bisa saja memenuhi kategori dari 2 kelas yang berbeda.
Contoh :
Tujuan dari pembelajaran (training) adalah untuk meminimalkan error sehingga kinerja learning machine (model) diukur oleh squared error. Dengan kata lain, utility function adalah meminimalkan squared error.
θ adalah learning parameter dan θ^ adalah nilai parameter paling optimal. Dan L adalah loss function.
7. Batasan Model Linear
Terdapat 2 batasan
yaitu:
a.
Additive
assumption
Additive assumption
berarti model linear menganggap hubungan antara input dan output adalah linear
a.
Linear
assumption
Linear assumption berarti perubahan pada suatu fitur xi mengakibatkan perubahan yang konstan terhadap output, walaupun seberapa besar/kecil nilai xi tersebut.
Underfitting
adalah keadaan ketika kinerja model bernilai buruk baik pada training atau
validation maupun testing data.
Overfitting
adalah keadaan ketika kinerja model bernilai baik untuk training tetapi buruk pada
unseen data.
Merupakan
suatu metode untuk menghindari overfitting. Caranya degan mengontrol
kompleksitas parameter.
Dimana R(w) adalah fungsi regularization dan L adalah parameter control.
10. Transformasi Data
Fungsi transformasi
yang digunakan :
Beberapa fungsi
transformasi :
1. Fisher Kernel
2. Graph Kernel
3. Kernel Smoother
4. Polynomial Kernel
5. Radial Basis Function Kernel
6. String Kernel
Tidak ada komentar:
Posting Komentar