Pengklasifikasi linear

Dalam pemelajaran mesin, pengklasifikasi linear adalah klasifikasi yang mengambil keputusan berdasarkan nilai kombinasi linear dari sifat-sifatnya. Sifat-sifat suatu objek disebut juga nilai fitur (ciri) dan biasa dinyatakan dalam vektor yang disebut vektor fitur. Pengklasifikasi ini bekerja dengan baik untuk permasalahan praktis seperti klasifikasi dokumen dan masalah-masalah yang memiliki banyak variabel (fitur) hingga mencapai tingkat akurasi yang sekelas dengan pengklasifikasi nonlinear dengan waktu pelatihan yang lebih sedikit.[1]

Definisi

Pada kasus ini, bulatan isi dan bulatan kosong dapat diklasifikasikan dengan benar oleh banyak pengklasifikasi linear. H1 (biru) mengklasifikasikan dengan benar. Begitu juga H2 (merah). H2 dapat dianggap "lebih baik" dalam artian bahwa garisnya berada paling jauh dari kedua kelompok. H3 (hijau) gagal mengklasifikasikan bulatan-bulatan tersebut dengan benar.

Jika vektor fitur input pengklasifikasi adalah vektor riil , nilai keluarannya adalah

dengan adalah vektor riil bobotnya dan adalah fungsi yang mengubah produk skalar dua vektor ke bentuk keluaran yang diinginkan. Vektor bobot dipelajari dari himpunan sampel pelatihan yang telah dilabeli. Biasanya, fungsi adalah fungsi ambang batas yang memetakan semua nilai yang di atas batas tertentu ke dalam kelas pertama dan nilai-nilai lainnya ke dalam kelas kedua, misalnya

Fungsi yang lebih kompleks mungkin dapat memberikan peluang suatu barang termasuk kelas tertentu.

Lihat pula

Referensi

  1. ^ Guo-Xun Yuan; Chia-Hua Ho; Chih-Jen Lin (2012). "Recent Advances of Large-Scale Linear Classification" (PDF). Proc. IEEE. 100 (9). 

Bacaan lebih lanjut

  1. Y. Yang; X. Liu (1999). "A re-examination of text categorization". Proc. ACM SIGIR Conference: 42–49. 
  2. R. Herbrich (2001). Learning Kernel Classifiers: Theory and Algorithms. MIT Press. ISBN 0-262-08306-X. 


Kembali kehalaman sebelumnya