
Author
Muhammad Syahrullah(1

(1) Universitas Trunojoyo Madura, Indonesia
(2) Universitas Trunojoyo Madura, Indonesia
(3) Universitas Trunojoyo Madura, Indonesia

Article Analytic |
Available online: 2024-12-30 | Published : 2024-12-30
Copyright (c) 2025 Muhammad Syahrullah
Article can trace at:
Article Metrics
Abstract Views: 0 times
PDF Downloaded: 0 times
Abstract
Natural Language Processing (NLP) terus berkembang hingga saat ini. Dalam 10 tahun terakhir, NLP berkembang pesat seiring meningkatnya ketersediaan teks elektronik saat ini. Salah satu contoh aplikasi yang mengimplementasikan pendekatan NLP adalah Similarity Detection atau deteksi kemiripan. Deteksi kemiripan digunakan untuk mengetahui seberapa mirip dokumen teks satu dengan lainnya. Dokumen teks merupakan sebuah tulisan yang tercetak yang bertujuan untuk menerangkan atau memberikan sebuah informasi tertentu. Pada penelitian ini, metode Jaro-Winkler Distance dikombinasikan dengan Synonym Recognition untuk mendeteksi nilai persentase kemiripan dari dokumen abstrak skripsi. Abstrak skripsi yang digunakan adalah abstrak skripsi dari Program Studi Infromatika Fakultas Teknik Universitas Trunojoyo Madura dengan jumlah 110 abstrak. Dari uji coba yang telah dilakukan, diperoleh hasil bahwa dengan menggunakan kombinasi metode Jaro-Winkler Distance dengan Synonym Recognition dinilai kurang efektif karena score yang dihasilkan lebih rendah. Uji coba dilakukan menggunakan data sintetis potongan dan data sintetis gabungan. Tujuan dari dibuatnya data sintetis untuk menjadi ground truth atau acuan peneliti terhadap nilai similarity yang asli dari query yaitu agar dapat menghasilkan nilai Error Rate dari kinerja metode Jaro-Winkler Distance dan Synonym Recognition. Error Rate yang diperoleh tanpa menggunakan Synonym Recognition memiliki nilai sebesar 0.005511, sedangkan menggunakan Synonym Recognition diperoleh nilai sebesar 0.0397.
Keywords
References
M. Amien, “Sejarah dan Perkembangan Teknik Natural Language Processing (NLP) Bahasa Indonesia: Tinjauan tentang sejarah, perkembangan teknologi, dan aplikasi NLP dalam bahasa Indonesia,” Mar. 2023,
E. D. Liddy, “Natural Language Processing Natural Language Processing Natural Language Processing 1,” 2001
K. Proposal Dan Isi Skripsi Dengan Algoritma Rabin-Karp, L. Juliana Purba, and L. Sitorus, “Perancangan Aplikasi Untuk Menghitung Persentase,” 2018.
G. E. I. Kambey, R. Sengkey, and A. Jacobus, “Penerapan Clustering pada Aplikasi Pendeteksi Kemiripan Dokumen Teks Bahasa Indonesia,” Jurnal Teknik Informatika, vol. 15, no. 2, pp. 75–82.
T. Bollé and E. Casey, “Using computed similarity of distinctive digital traces to evaluate non-obvious links and repetitions in cyber-investigations,” in DFRWS 2018 EU - Proceedings of the 5th Annual DFRWS Europe, Digital Forensic Research Workshop, 2018, pp. S2–S9. doi: 10.1016/j.diin.2018.01.002.
T. Efriyanto and M. Hayaty, “975 Jaro Winkler Algorithm For Measuring Similarity Online News,” Jurnal Teknik Informatika (JUTIF), doi: 10.20884/1.jutif.2022.3.4.152.
N. Prima Putra and S. Sularno, “Penerapan Algoritma Rabin-Karp Dengan Pendekatan Synonym Recognition Sebagai Antisipasi Plagiarisme Pada Penulisan Skripsi,” Jurnal Teknologi Dan Sistem Informasi Bisnis, vol. 1, no. 2, pp. 48–58, Jul. 2019, doi: 10.47233/jteksis.v1i2.52.
I. Syahputra and F. Syakti, “Perbandingan Algoritma Levenshtein dan Jaro Winkler Pada Sistem Informasi Pencarian Dokumen Perundang-Undangan (Studi Kasus : Diskominfo Lahat),” SMATIKA JURNAL, vol. 12, no. 02, pp. 176–186, Dec. 2022, doi: 10.32664/smatika.v12i02.696.
P. C. S. Mahendra, “Deteksi Similarity Abstrak Skripsi Menggunakan Metode,” 2022.
R. Rosyadi and S. Al-Faraby, “Penerapan Question Answering System Pada Pembahasan Agama Islam Dengan Pendekatan Metode Pattern Based,” vol. 2, no. 4, 2018.
H. Nur Hanani, H. Jayadianti, H. Cahya Rustamaji, and U. Pembangunan Nasional Veteran Yogyakarta, “Fuzzy String Matching for Semi-Automatication of Words with Jaro Winkler Distance Algorithm on Microsoft Word Documents Fuzzy String Matching untuk Semi-Otomatisasi Pencocokan Kata dengan Algoritma Jaro Winkler Distance pada Dokumen Microsoft Word,” pp. 13–2021, [Online]. Available: www.myvocabulary.com
Bunga Dea Laraswati, “Data Sintetis: Apa Itu dan Apa Kegunaannya?,” Algoritma.
R. P. Pratama, M. Faisal, and A. Hanani, “Deteksi Plagiarisme pada Dokumen Jurnal Menggunakan Metode Cosine Similarity,” SMARTICS Journal, vol. 5, no. 1, pp. 22–26, Apr. 2019, doi: 10.21067/smartics.v5i1.2848.
D. Plagiarisme et al., “Techno Xplore Jurnal Ilmu Komputer dan Teknologi Informasi.” [Online]. Available: http://www.smallseotools.com/
S. Fatonah, A. Hadinegoro, A. Hadinegoro, A. D. Hartanto, and A. D. Hartanto, “Deteksi Kemiripan Abstraksi Tugas Akhir Diploma Informatika Universitas AMIKOM Yogyakarta dengan Algoritma Rabin Karp,” JURIKOM (Jurnal Riset Komputer), vol. 7, no. 1, p. 1, Feb. 2020, doi: 10.30865/jurikom.v7i1.1927.
“Portal Tugas Akhir Universitas Trunojoyo Madura.”, https://pta.trunojoyo.ac.id/
Refbacks
- There are currently no refbacks.