Deteksi plagiarismeDeteksi plagiarisme adalah proses pencarian bagian yang diduga plagiat dari sebuah karya. Dalam hal ini, karya tidak hanya terbatas pada dokumen, tetapi juga desain baik gambar atau video, dan kode program. Meskipun kasus yang umum terjadi pada tulisan ilmiah baik berupa esai atau laporan. Dengan perkembangan komputer dan internet menjadikan orang mudah untuk memplagiat kaya seseorang. Pendeteksian plagiarisme dapat dilakukan baik secara manual atau otomatis menggunakan perangkat lunak. Deteksi plagiarisme secara manual memerlukan usaha yang besar disertai dengan ingatan yang baik, mengingat banyaknya dokumen yang harus bandingkan. Oleh karena itu, pendeteksian menggunakan perangkat lunak akan lebih memudahkan tugas ini. Sistem pendeteksi plagiarismeKebanyakan sistem yang dikembangkan untuk mendeteksi plagiarisme memodifikasi sistem temu balik. Dalam teks dokumenSistem pendeteksi plagiarism secara umum menggunakan dua pendekatan berikut ini: eksternal dan intrinsik.[1] Pendeteksian eksternal membandingkan sebuah dokumen yang dicurigai plagiat (dokumen input) dengan seluruh dokumen pada sebuah koleksi dokumen yang diasumsikan sebagai dokumen origina.[2] Dengan memodelkan dokumen dan menentukan batas kesamaan dua buah dokumen dianggap plagiat, sistem pendeteksi akan mencari seluruh dokumen yang memiliki kesamaan teks dengan dokumen input melebihi batas tersebut.[3] Sedangkan pendeteksian intrinsik adalah menganalisi dokumen input tanpa membandingkan dengan dokumen lain dalam sebuah koleksi dokumen. Pendetekan ini bertujuan untuk menganalisis gaya penulisan dari dokumen input.[4] Sistem pendeteksi plagiarisme tidak bisa berkerja tanpa manusia. Manusia yang akan menilai apakah kesamaan pada dua buah dokumen merupakan plagiarisme atau bukan. Oleh karena itu, bisa saja terdapat dokumen yang mestinya bukan sumber plagiat, oleh sistem dianggap sebagai sumber.[5][6][7][8][9] PendekatanGambar di bawah ini menunjukkan klasifikasi dari semua pendekatan yang digunanakan dalam pengembangan perangkat lunak untuk pendeteksian plagairisme. Pendekatan dapat dikarakterisasikan berdasarkan perbandingan yang dilakukan, yakni: global dan lokal. Perbandingan global membandingkan dua buah teks pada level dokumen, sedangkan lokal membandingkan hanya sebagian dari dokumen baik input maupun kandidat sumber. Sidik jariSidik jari yang dimaksud dalam konteks ini adalah bukan merupakan sidik jari dari penulis sebuah dokumen, melainkan mengekstrak informasi dari dokumen dan menggunakan informasi ini sebagai sidik jari dari dokumen tersebut. Metode sidik jari banyak digunakan untuk tugas ini. Untuk menghasilkan sidik jari, umumnya metode n-gram digunakan. Proses pendeteksian plagiarisme dilakukan dengan membandingkan sidik jari dari dokumen input dengan sidik jari tiap dokumen dalam koleksi dokumen. Sidik jari untuk setiap dokumen umumnya telah dihasilkan terlebih dahulu sebelum proses pendeteksian dilakukan. Dokumen-dokumen yang memiliki banyak kesamaan sidik jari akan ditampilkan sebagai kandidat dokumen sumber.[10] Keuntungan dengan menggunakan sidik jari dokumen adalah proses perbandingan akan semakin cepat.[11] Lihat pulaReferensi
|