Abstract
Natural Language Processing (NLP) terus berkembang hingga saat ini. Dalam 10 tahun terakhir, NLP berkembang pesat seiring meningkatnya ketersediaan teks elektronik saat ini. Salah satu contoh aplikasi yang mengimplementasikan pendekatan NLP adalah Similarity Detection atau deteksi kemiripan. Deteksi kemiripan digunakan untuk mengetahui seberapa mirip dokumen teks satu dengan lainnya. Dokumen teks merupakan sebuah tulisan yang tercetak yang bertujuan untuk menerangkan atau memberikan sebuah informasi tertentu. Pada penelitian ini, metode Jaro-Winkler Distance dikombinasikan dengan Synonym Recognition untuk mendeteksi nilai persentase kemiripan dari dokumen abstrak skripsi. Abstrak skripsi yang digunakan adalah abstrak skripsi dari Program Studi Infromatika Fakultas Teknik Universitas Trunojoyo Madura dengan jumlah 110 abstrak. Dari uji coba yang telah dilakukan, diperoleh hasil bahwa dengan menggunakan kombinasi metode Jaro-Winkler Distance dengan Synonym Recognition dinilai kurang efektif karena score yang dihasilkan lebih rendah. Uji coba dilakukan menggunakan data sintetis potongan dan data sintetis gabungan. Tujuan dari dibuatnya data sintetis untuk menjadi ground truth atau acuan peneliti terhadap nilai similarity yang asli dari query yaitu agar dapat menghasilkan nilai Error Rate dari kinerja metode Jaro-Winkler Distance dan Synonym Recognition. Error Rate yang diperoleh tanpa menggunakan Synonym Recognition memiliki nilai sebesar 0.005511, sedangkan menggunakan Synonym Recognition diperoleh nilai sebesar 0.0397.