Klasifikasi dokumenDalam ilmu perpustakaan, ilmu informasi dan ilmu komputer, klasifikasi dokumen atau kategorisasi dokumen ialah persoalan kepada menetapkan suatu dokumen ke satu atau lebih kelas atau kategori. Dapat dicapai secara manual (intelektual) atau secara algoritma. Klasifikasi intelektual akan dokumen sebagian besar telah menjadi bidang ilmu perpustakaan, sementara klasifikasi secara algoritma akan dokumen ialah utama dalam ilmu informasi dan ilmu komputer. Dokumen yang mendapat klasifikasi bisa berupa teks, gambar, musik, dll. Setiap macam dokumen memiliki persoalan klasifikasi khusus. Kala tidak ditentukan, klasifikasi teks terlibat. Dokumen dapat dikategorikan berdasarkan dengan subjek atau atribut lain (seperti jenis dokumen, pengarang, tahun cetakan, dll). Terdapat dua filosofi utama dari subjek klasifikasi dokumen: pendekatan klasifikasi berbasis konten dan pendekatan klasifikasi berbasis permintaan. PendekatanKlasifikasi berbasis konten ialah klasifikasi yang mana bobot diberikan kepada subjek tertentu dalam suatu dokumen yang menentukan kelas tempat dokumen ditetapkan. Pada klasifikasi otomatis dapat menjadi berapa banyak kata yang diberikan muncul dalam dokumen. Klasifikasi berbasis permintaan (atau pengindeksan) ialah klasifikasi yang mengantisipasi permintaan dari pengguna memengaruhi bagaimana dokumen diklasifikasikan. Pengklasifikasi memeriksa: "Antara deskripsi mana entitas dapat ditemukan?" dan "pertimbangkan semua gerangan pertanyaan dan tentukan terhadap mana satu entitas yang relevan".[1] Klasifikasi dokumen otomatisFungsi klasifikasi dokumen otomatis dapat dibagi ke dalam tiga macam: klasifikasi dokumen supervisi yang mana beberapa mekanisme eksternal (seperti umpan balik) menyediakan informasi pada klasifikasi yang tepat terhadap dokumen, klasifikasi dokumen non-supervisi yang mana klasifikasi harus dikerjakan penuh tanpa mengacu kepada informasi eksternal dan klasifikasi dokumen semi-supervisi yang mana bagian dokumen diberi label dengan mekanisme eksternal. TeknikTeknik-teknik klasifikasi dokumen otomatis termasuk:
AplikasiTeknik-teknik klasifikasi yang telah diterapkan kepada
Lihat pulaReferensi
|