Implementasi Model Sentence-Bert untuk Deteksi Plagiarisme Pada Karya Tulis Ilmiah Psikologi Berbahasa Indonesia

Authors

  • Ilhan Hakiki Universitas Muhammadiyyah Bandung, Indonesia
  • Firas Atqiya Universitas Muhammadiyyah Bandung, Indonesia
  • Ahmad Suryan Universitas Muhammadiyyah Bandung, Indonesia

DOI:

https://doi.org/10.59141/cerdika.v5i12.2889

Keywords:

Sentence-BERT, Cosine Similarity, Plagiarisme, Psikologi, Deteksi Teks

Abstract

Plagiarisme merupakan permasalahan serius dalam dunia akademik, khususnya pada karya tulis ilmiah berbahasa Indonesia di bidang psikologi. Bidang psikologi merupakan salah satu bidang yang rentan terhadap plagiarisme. Penelitian ini bertujuan untuk mengimplementasikan metode Sentence-BERT dalam mendeteksi tingkat kemiripan antar teks guna mengidentifikasi potensi plagiarisme. Dataset yang digunakan terdiri dari 15 pasang abstrak karya tulis ilmiah psikologi yang dikategorikan ke dalam lima jenis, yaitu copy-paste murni, parafrase kuat, mosaik, topik berbeda, dan topik mirip. Setiap pasangan data dibandingkan menggunakan Sentence-BERT untuk menghasilkan embedding semantik, lalu dihitung tingkat kemiripannya dengan cosine similarity. Hasil pengujian menunjukkan bahwa metode Sentence-BERT cukup efektif mendeteksi plagiarisme dengan akurasi global 53,3%, terutama pada kasus copy-paste murni (100%). Namun, kelemahan ditemukan pada kategori mosaik (0%) dan topik mirip (33,3%), di mana model masih kesulitan membedakan teks yang memiliki kesamaan semantik meski berbeda tujuan atau struktur. Dengan demikian, Sentence-BERT terbukti unggul dalam mendeteksi plagiarisme eksplisit, tetapi perlu pengembangan lebih lanjut agar mampu mengenali plagiarisme kompleks.

Downloads

Published

2025-12-17

How to Cite

Hakiki, I., Atqiya, F. ., & Suryan, A. . (2025). Implementasi Model Sentence-Bert untuk Deteksi Plagiarisme Pada Karya Tulis Ilmiah Psikologi Berbahasa Indonesia . Cerdika: Jurnal Ilmiah Indonesia, 5(12), 3109–3125. https://doi.org/10.59141/cerdika.v5i12.2889