Klasifikasi Penyakit Hepatitis C dengan Menggunakan K-Nearest Neighbor

Author


Fathul Qorib Yusfila(1Mail), Bain Khusnul Khotimah(2), Devie Rosa Anamisa(3), Ana Tsalitsatun Ni’mah(4),
(1) Universitas Trunojoyo Madura, Indonesia
(2) Universitas Trunojoyo Madura, Indonesia
(3) Universitas Trunojoyo Madura, Indonesia
(4) Universitas Trunojoyo Madura, Indonesia

Mail Corresponding Author
Article Analytic
  [File Size: 437KB]  Language: id
Available online: 2025-06-03  |  Published : 2025-06-03
Copyright (c) 2025 Fathul Qorib Yusfila
Article can trace at:

Article Metrics

Abstract Views: 21 times PDF Downloaded: 12 times

Abstract


Hepatitis merupakan kondisi peradangan pada hati yang disebabkan oleh berbagai jenis virus, baik yang menular maupun tidak menular, dan dapat menimbulkan komplikasi serius hingga kematian. Terdapat lima tipe utama virus hepatitis, yaitu A, B, C, D, dan E. Penelitian ini bertujuan untuk mengklasifikasikan penyakit Hepatitis C menggunakan algoritma K-Nearest Neighbor (KNN) dengan pendekatan penanganan data tidak seimbang melalui teknik Random Oversampling. Dataset yang digunakan adalah HCV dari UCI Machine Learning Repository, yang terdiri dari 615 data dengan 14 fitur dan 5 kategori kelas. Karena data bersifat tidak seimbang, dilakukan peningkatan jumlah data pada kelas minoritas menggunakan Random Oversampling. Proses evaluasi dilakukan dengan membandingkan performa KNN tanpa dan dengan oversampling, serta menentukan nilai K terbaik melalui skenario pengujian menggunakan 5-fold Cross Validation. Hasil menunjukkan bahwa KNN tanpa oversampling menghasilkan akurasi tertinggi sebesar 94% pada nilai K=3, sementara dengan oversampling akurasi meningkat menjadi 96,70% pada nilai K yang sama. Dengan demikian, dapat disimpulkan bahwa penerapan Random Oversampling mampu meningkatkan performa klasifikasi algoritma KNN pada data Hepatitis C yang tidak seimbang.

Keywords


Hepatitis C; Klasifikasi; K-Nearest Neighbor; Random Oversampling; Cross Validation

References


Aditya, A., Mustofa, F. L., Hidayat, H., & Firlanda, Z. R. S. (2022). Prevalensi Hepatitis C Pada Donor Darah Sebelum Dan Pada Saat Pandemi Covid 19 Di Unit Transfusi Darah Palang Merah Indonesia Provinsi Lampung Tahun 2019-2020. Malahayati Nursing Journal, 4(6), 1544-1556. https://doi.org/10.33024/mnj.v4i6.6460

Kurniawati, S. A., Karjadi, T. H., & Gani, R. A. (2015). Faktor-faktor yang berhubungan dengan kejadian hepatitis C pada pasangan seksual pasien koinfeksi Human Immunodeficiency Virus dan virus hepatitis C. Jurnal Penyakit Dalam Indonesia, 2(3), 133-139.

Saraswati, A. et al., “Faktor Risiko Terjadinya Penyakit Hepatitis C,” 2022, [Online]. Available: http://jurnal.globalhealthsciencegroup.com/index.php/JPPP

Senduk, V. Y., & Parmadi, E. H. (2022). Klasifikasi User yang Berpotensi Melakukan Pembelian Barang Online Menggunakan Algoritme Weighted K-Nearest Neighbor. In Prosiding Seminar Nasional Ilmu Sosial dan Teknologi (SNISTEK). 4 pp. 109-114.

Setiawan, S. B., Adiwijaya, A., & Mubarok, M. S. (2018). Klasifikasi Topik Berita Berbahasa Indonesia menggunakan Weighted K-Nearest Neighbor. eProceedings of Engineering, 5(1).

Ni'mah, A. T., & Syuhada, F. (2022). Term Weighting Based Indexing Class and Indexing Short Document for Indonesian Thesis Title Classification. Journal of Computer Science and Informatics Engineering (J-Cosine), 6(2), 167-175. https://doi.org/10.29303/jcosine.v6i2.471

Khotimah, B. K., & Syarief, M. (2011). Aplikasi Data Mining Untuk Mengukur Tingkat Kelulusan Mahasiswa Dengan Metode Apriori Dan K-Mean Clustering (Studi Kasus Jurusan Teknik Informatika UTM). Jurnal Simantec, 2(2), 71-80. https://doi.org/10.21107/simantec.v2i2.13394

Toyibah, Z. B., Putri, Y. N., Puandini, P., Widodo, Z. M., & Ni'mah, A. T. (2024). Perbandingan Kinerja Algoritma Multinomial Naïve Bayes dan Logistic Regression pada Analisis Sentimen Movie Ratings IMDB. Jurnal Ilmiah Edutic: Pendidikan dan Informatika, 10(2), 181-189.

Ni’mah, A. T., & Yunitarini, R. (2024). Relevance of the Retrieval of Hadith Information (RoHI) using Bidirectional Encoder Representations from Transformers (BERT) in religious education media. In BIO Web of Conferences (Vol. 146, p. 01041). EDP Sciences. https://doi.org/10.1051/bioconf/202414601041

Ni'mah, A. T., & Arifin, A. Z. (2020). Perbandingan Metode Term Weighting terhadap Hasil Klasifikasi Teks pada Dataset Terjemahan Kitab Hadis. Rekayasa, 13(2), 172–180. https://doi.org/10.21107/rekayasa.v13i2.6412

Raharja, K. Y., Oktavianto, H., & Umilasari, R. (2021). Perbandingan Kinerja Algoritma Gaussian Naive Bayes Dan K-Nearest Neighbor (KNN) Untuk Mengklasifikasi Penyakit Hepatitis C Virus (HCV). 1-12.

Desiani, A. (2022). Perbandingan Implementasi Algoritma Naïve Bayes dan K-Nearest Neighbor Pada Klasifikasi Penyakit Hati. Jurnal Sistem Informasi Dan Sistem Komputer, 7(2), 104-110. https://doi.org/10.51717/simkom.v7i2.96

Dafwen, T. (2021). Optimasi Nilai k Pada Algoritma k Nearest Neighbor Untuk Prediksi Akademik Mahasiswa Yang Bekerja. Indonesian Journal of Computer Science, 10(2), 379-388. https://doi.org/10.33022/ijcs.v10i2.3005

Nasution, D. A., Khotimah, H. H., & Chamidah, N. (2019). Perbandingan normalisasi data untuk klasifikasi wine menggunakan algoritma K-NN. Comput. Eng. Sci. Syst. J, 4(1), 78. https://doi.org/10.24114/cess.v4i1.11458

Batan, G. A., Keytimu, M. J., Katumbo, F. L., Binanto, I., & Sianipar, N. F.(2023) Penerapan Metode Random Forest, Gaussian NB, Dan KNN Terhadap Data Unbalance dan Data Balance Menggunakan Random Over Sampling Untuk Klasifikasi Senyawa. Keladi Tikus. 8th Seminar Nasional Teknik Elektro, Informatika dan Sistem Informasi (SINTaKS). https://doi.org/10.35842/sintaks.v2i1.26

Yunani, R. (2022) Pengenalan Tulisan Aksara Lampung Dengan Library Opencv Menggunakan Metode Projection Profile Dan Klasifikasi K-NN.

Lutfi, M., & Hasyim, M. (2019). Penanganan data missing value pada kualitas produksi jagung dengan menggunakan metode K-NN Imputation pada algoritma C4. 5. Jurnal RESISTOR (Rekayasa Sistem Komputer), 2(2), 89-104.. http://jurnal.stiki-indonesia.ac.id/index.php/jurnalresistor


Refbacks

  • There are currently no refbacks.