Login
Section Computer Science

Optimization of Transfer Learning VGG-16 and ResNet50 for Deep Learning-Based Classification of Edible and Poisonous Mushroom Images

Optimalisasi Transfer Learning VGG-16 dan ResNet50 untuk Klasifikasi Citra Jamur Edible dan Poisonous Berbasis Deep Learning
Vol. 11 No. 1 (2026): June :

Almira Zuhrotus Safira (1), Sindhu Rakasiwi (2)

(1) Universitas Dian Nuswantoro, Semarang, Indonesia
(2) Universitas Dian Nuswantoro, Semarang, Indonesia
Fulltext View | Download

Abstract:

General Background Accurate identification of edible and poisonous mushrooms is critical for food safety because high visual similarity among species often causes misclassification. Specific Background Deep learning with transfer learning using Convolutional Neural Networks has been widely applied for image-based mushroom classification, particularly through pretrained architectures such as VGG-16 and ResNet50. Knowledge Gap Nevertheless, limited comparative evidence exists regarding which architecture provides more stable and balanced performance when applied to relatively small and diverse mushroom image datasets. Aims This study compares VGG-16 and ResNet50 transfer learning models for binary mushroom toxicity classification using the Kaggle Edible and Poisonous Mushroom Images dataset consisting of 2,820 images from 47 species. Results Using a 70:15:15 training, validation, and testing split with standardized preprocessing and data augmentation, the fine-tuned VGG-16 model achieved 96% test accuracy with a loss of 0.1671, while the ResNet50 model reached 92% accuracy with a loss of 0.2991. Both models obtained a ROC AUC value of 1.000, although VGG-16 demonstrated more balanced precision, recall, and F1-scores across classes. Novelty This research presents a direct and systematic comparison of two widely used pretrained CNN architectures under identical experimental settings. Implications The findings support automated mushroom toxicity identification to assist safer mushroom consumption decisions.


Highlights:




  • The strongest model achieved 96% accuracy with lower classification loss.




  • The alternative model produced lower accuracy under identical conditions.




  • Both approaches reached perfect ROC AUC with differing class balance.




Keywords: Deep Learning, Convolutional Neural Network (CNN), VGG-16, ReNet50, Mushroom Image Classification

Downloads

Download data is not yet available.

Pendahuluan

Jamur merupakan kelompok organisme eukariotik yang memiliki peran strategis dalam berbagai bidang, terutama pada sektor pangan, kesehatan, dan ekologi [1]. Sejumlah spesies, seperti Pleurotus ostreatus dan Lentinula edodes, dimanfaatkan secara luas sebagai sumber pangan bergizi karena kandungan protein, serat, serta senyawa bioaktif yang mendukung kesehatan manusia. Selain fungsi nutrisinya, beragam jenis jamur juga dimanfaatkan dalam bidang medis sebagai penghasil antibiotik dan senyawa biofarmasi, sekaligus berperan menjaga keseimbangan ekosistem melalui proses dekomposisi material organik di lingkungan [2]. Upaya identifikasi spesies jamur menjadi sangat penting, baik untuk kepentingan kajian keanekaragaman hayati maupun untuk mengoptimalkan pemanfaatannya pada berbagai sektor terapan. Pendekatan identifikasi konvensional umumnya dilakukan melalui pengamatan karakter morfologi makroskopik, seperti bentuk, warna, ukuran, dan tekstur tubuh buah jamur. Meskipun telah digunakan secara luas, metode ini memiliki sejumlah keterbatasan, antara lain tingginya kemiripan morfologi antarspesies dan kompleksitas variasi visual yang menyebabkan proses klasifikasi menjadi sulit dan rentan terhadap kesalahan. Kondisi tersebut mengindikasikan kebutuhan akan metode identifikasi yang lebih efisien, akurat, dan adaptif terhadap keragaman data citra jamur.

Kemajuan teknologi informasi, khususnya dalam bidang kecerdasan buatan (Artificial Intelligence), membuka peluang baru melalui pemanfaatan teknik Deep Learning untuk pengenalan dan klasifikasi citra biologis [3]. Pendekatan Deep Learning memungkinkan model melakukan pembelajaran langsung dari data citra tanpa memerlukan perancangan fitur secara manual, sehingga lebih mampu menangkap pola visual kompleks secara otomatis dan terstruktur [4]. Di antara berbagai arsitektur yang ada, Convolutional Neural Network (CNN) menjadi salah satu model yang paling banyak digunakan karena kemampuannya mengekstraksi fitur spasial secara hierarkis, dari pola sederhana hingga representasi visual tingkat tinggi, dan telah terbukti memberikan kinerja unggul pada tugas-tugas seperti deteksi penyakit tanaman, klasifikasi hewan, dan pengenalan wajah.

Berbagai arsitektur CNN telah dikembangkan untuk meningkatkan performa klasifikasi citra, di antaranya VGG-16 dan ResNet50 yang banyak diadopsi dalam penelitian terkini. VGG-16 memanfaatkan konfigurasi bertingkat dari lapisan konvolusi berukuran 3×3 yang terstruktur secara berurutan sehingga efektif dalam menangkap detail tekstur dan pola visual halus [5]. Sebaliknya, ResNet50 mengusung konsep residual learning yang memungkinkan pelatihan jaringan dengan kedalaman besar tanpa mengalami degradasi kinerja, serta membantu mengatasi masalah vanishing gradient selama proses optimasi[6]. Kedua arsitektur ini telah diaplikasikan secara luas pada berbagai domain klasifikasi citra, seperti analisis citra medis, deteksi penyakit tanaman, dan klasifikasi objek biologis lainnya, dan dilaporkan mampu mencapai tingkat akurasi yang tinggi.

Sejumlah studi sebelumnya menunjukkan bahwa VGG-16 dan ResNet50 mampu memberikan performa klasifikasi yang kompetitif pada berbagai jenis citra. Beberapa penelitian melaporkan bahwa ResNet-berkedalaman lebih tinggi, seperti ResNet152, mampu mencapai akurasi lebih tinggi dibandingkan model lain dalam skenario tertentu, sementara VGG-16 tetap menjadi pilihan populer karena struktur arsitekturnya yang relatif sederhana dan stabil sehingga sering digunakan sebagai model dasar pada penelitian klasifikasi citra. [7] Hasil-hasil tersebut mengindikasikan bahwa ResNet50 umumnya memiliki keunggulan dalam hal akurasi dan efisiensi pelatihan, tetapi VGG-16 masih relevan sebagai baseline yang kuat dan mudah diimplementasikan.

Pada penelitian ini digunakan dataset dari platform Kaggle berjudul “Edible and Poisonous Mushroom Images” yang berisi sekitar 2.000 citra jamur dari dua kelas utama, yaitu edible (dapat dimakan) dan poisonous (beracun) [8]. Dataset tersebut memiliki tingkat keragaman visual yang tinggi, antara lain variasi pencahayaan, latar belakang, warna tudung jamur, tekstur permukaan, bentuk batang, serta kondisi lingkungan tempat pengambilan gambar. Variasi ini merupakan faktor penting dalam membangun model klasifikasi yang memiliki kemampuan generalisasi yang baik terhadap kondisi nyata.

Selain aspek teknis, klasifikasi jamur juga memiliki dampak sosial dan praktis yang signifikan. Kesalahan dalam mengidentifikasi jamur dapat berakibat fatal karena sejumlah spesies beracun memiliki kemiripan morfologi dengan jamur yang dapat dikonsumsi. Kasus keracunan jamur di masyarakat umumnya terjadi akibat keterbatasan pengetahuan visual dalam membedakan keduanya[9]. Oleh karena itu, pengembangan sistem klasifikasi jamur berbasis kecerdasan buatan dapat memberikan peringatan dini, meningkatkan keamanan pangan, serta membantu meminimalkan risiko kesalahan identifikasi di lapangan.

Berdasarkan urgensi tersebut, penelitian ini bertujuan untuk membandingkan performa dua arsitektur Deep Learning populer, yaitu VGG-16 dan ResNet50, dalam melakukan klasifikasi citra jamur. Perbandingan dilakukan untuk menentukan model yang paling optimal dalam mengidentifikasi jenis jamur secara otomatis berdasarkan akurasi, stabilitas pelatihan, serta efisiensi komputasi. Melalui pendekatan ini, penelitian ini diharapkan mampu menghasilkan model klasifikasi dengan performa tinggi yang dapat diaplikasikan dalam berbagai kebutuhan praktis.

Met ode

Penelitian ini menggunakan metode eksperimen kuantitatif berbasis deep learning dengan pendekatan komparatif untuk membandingkan kinerja dua arsitektur Convolutional Neural Network (CNN), yaitu VGG-16 dan ResNet50, pada tugas klasifikasi citra jamur edible dan poisonous[10]. Dataset yang digunakan berasal dari Kaggle “Edible and Poisonous Mushroom Images” yang berisi 2.820 citra dari 47 spesies jamur dan dibagi secara acak menjadi data latih, validasi, dan uji dengan proporsi 70:15:15. Tahap prapemrosesan meliputi pengubahan ukuran citra menjadi 224×224 piksel, normalisasi sesuai standar masing-masing arsitektur, serta augmentasi berupa rotasi, translasi, zoom, pengaturan kecerahan, channel shift, dan horizontal flip guna meningkatkan keragaman data dan mengurangi overfitting[11].

Model dibangun dengan skema transfer learning menggunakan bobot pralatih ImageNet, di mana VGG-16 dimanfaatkan sebagai feature extractor dengan penggantian layer klasifikasi menjadi dua kelas dan dilakukan fine-tuning pada beberapa lapisan atas, sedangkan ResNet50 digunakan sebagai feature extractor dengan penyesuaian pada lapisan klasifikasi akhir tanpa fine-tuning mendalam pada backbone. Proses pelatihan kedua model dilakukan menggunakan optimizer Adam, fungsi loss Binary Crossentropy dengan label smoothing, batch size 32, serta mekanisme EarlyStopping dan ReduceLROnPlateau untuk menjaga stabilitas pelatihan dan mencegah overfitting[12]. Kinerja model dievaluasi pada data uji menggunakan metrik akurasi, loss, precision, recall, F1-score, dan Area Under Curve (AUC) ROC untuk memperoleh gambaran komprehensif mengenai kemampuan klasifikasi jamur edible dan poisonous. Hasil evaluasi kedua arsitektur kemudian dianalisis dan dibandingkan untuk menentukan model yang paling optimal dari segi akurasi, kestabilan pelatihan, dan kemampuan generalisasi pada variasi tekstur dan warna jamur yang tinggi.

Hasil dan Pembahasan

Dataset yang digunakan pada penelitian ini berasal dari platform Kaggle dengan judul “Edible and Poisonous Mushroom Image”, yaitu dataset publik yang memuat citra jamur dari dua kelas utama, yakni jamur edible (dapat dikonsumsi) dan jamur poisonous (beracun), dengan jumlah kurang lebih 2000 citra jamur[8]. Dataset ini dipilih karena memiliki keragaman karakteristik visual yang tinggi, meliputi variasi pencahayaan, warna tudung, tekstur permukaan, bentuk dan ukuran batang serta tubuh buah, hingga perbedaan latar belakang lingkungan. Keberagaman tersebut penting untuk meningkatkan kemampuan generalisasi model dalam mengenali jamur pada kondisi dunia nyata yang bervariasi. Secara visual, citra pada dataset menampilkan berbagai kondisi pencahayaan, mulai dari terang, redup, hingga kombinasi cahaya alami dan buatan, sehingga model dilatih untuk tetap robust terhadap perubahan intensitas cahaya. Warna tudung jamur juga sangat bervariasi, mencakup putih, coklat muda hingga coklat gelap, jingga, merah, maupun corak kombinasi, sehingga model tidak hanya mengandalkan satu atribut warna dalam proses klasifikasi. Selain itu, tekstur permukaan jamur menunjukkan pola yang beragam, seperti halus, berpori, berbintik, bergaris, hingga bersisik, yang menjadi salah satu fitur penting dalam membedakan jamur edible dan poisonous[13]

Variasi bentuk morfologi juga cukup luas, baik dari sisi batang maupun tudung jamur. Terdapat jamur dengan batang panjang-kecil hingga pendek-tebal, serta tudung dengan bentuk cembung, datar, kerucut, maupun melengkung ke bawah. Ukuran objek jamur dan resolusi citra yang tidak seragam mengharuskan dilakukannya tahapan prapemrosesan, seperti resizing, agar seluruh citra memiliki dimensi yang konsisten sebelum dijadikan masukan ke model. Di sisi lain, latar belakang citra meliputi lingkungan hutan, tanah lembap, rerumputan, dedaunan, kayu lapuk, hingga latar belakang polos, yang berpotensi menjadi noise sehingga model perlu dilatih agar fokus pada objek jamur, bukan pada konteks sekelilingnya.

Dataset asli tidak menyediakan pembagian data pelatihan, validasi, dan pengujian secara langsung, sehingga pemisahan dilakukan secara manual dengan proporsi 70% untuk data latih, 15% untuk data validasi, dan 15% untuk data uji. Pembagian dilakukan secara acak dengan mempertimbangkan keseimbangan jumlah sampel pada setiap kelas, sehingga risiko bias model terhadap salah satu kategori dapat diminimalkan. Sebelum proses pelatihan, dilakukan visualisasi dan inspeksi awal citra untuk memastikan distribusi tiap kelas relatif merata serta tidak terdapat citra yang rusak, duplikat berlebih, atau tidak relevan dengan objek jamur[11]. Dengan konfigurasi tersebut, dataset dinilai memadai untuk digunakan sebagai dasar pembangunan dan evaluasi model klasifikasi jamur berbasis deep learning.

Tabel 1. Informasi Dataset

Visualisasi dataset berperan penting dalam memahami pola-pola visual yang potensial dikenali oleh model, seperti variasi bentuk tudung, warna permukaan jamur, hingga keberadaan bercak atau pola khas pada tubuh buah. Melalui visualisasi ini, peneliti dapat mengamati distribusi fitur visual secara lebih intuitif, sehingga dapat memastikan bahwa model memperoleh contoh yang representatif dan beragam selama proses pelatihan. Dengan demikian, visualisasi mendukung model dalam mempelajari representasi visual yang lebih kaya dan relevan, yang pada akhirnya dapat meningkatkan kinerja klasifikasi.

Figure 1. Folder Train

Figure 2. Folder Test

Visualisasi citra pada subset train menunjukkan adanya perbedaan pola visual yang cukup menarik antara kedua kelas jamur. Pada sebagian sampel, kelas poisonous cenderung memiliki tekstur permukaan yang lebih kompleks, misalnya bercak, pola tidak beraturan, atau kombinasi warna yang kontras, serta warna tudung yang lebih mencolok pada beberapa spesies[13]. Sebaliknya, kelas edible umumnya menampilkan karakteristik visual yang relatif lebih sederhana dengan warna yang lebih netral, meskipun masih terdapat banyak sampel yang secara visual sangat mirip dengan kelas poisonous, baik dari segi warna maupun bentuk[1]

Kemiripan visual ini berpotensi menjadi sumber kesalahan klasifikasi karena model harus membedakan perbedaan yang sangat halus antara dua kelas yang secara tampilan sering tumpang tindih. Kondisi tersebut menegaskan pentingnya penggunaan arsitektur deep learning yang mampu mengekstraksi fitur tingkat tinggi secara lebih diskriminatif, serta perlunya augmentasi dan regularisasi yang memadai agar model tidak hanya mengandalkan fitur dangkal seperti warna, tetapi juga pola tekstur dan struktur bentuk yang lebih kompleks[14]

1. Preprocessing Data

Data citra jamur yang digunakan dalam penelitian ini memiliki variasi tinggi dari sisi pencahayaan, orientasi, dan karakteristik warna, sehingga diperlukan strategi augmentasi untuk meningkatkan keragaman data sekaligus memperkuat kemampuan generalisasi model. Untuk tujuan tersebut, diterapkan beberapa teknik augmentasi, antara lain rotasi acak hingga 25°, pergeseran horizontal dan vertikal masing-masing hingga 10%, zoom hingga 25%, pengaturan tingkat kecerahan (brightness range) pada rentang 0,7–1,3, channel shift sebesar 20, serta horizontal flip untuk mensimulasikan pembalikan arah objek[15]. Kombinasi transformasi ini membuat model terekspos pada berbagai variasi tampilan jamur yang mendekati kondisi dunia nyata tanpa harus menambah data anotasi secara manual.

Selain transformasi geometris dan fotometris, seluruh citra juga dinormalisasi menggunakan fungsi preprocessing bawaan arsitektur VGG16 dan ResNet50, sehingga distribusi nilai piksel selaras dengan asumsi statistik model pralatih. Normalisasi ini penting untuk memastikan proses transfer learning berjalan stabil dan gradien yang dihasilkan berada pada skala yang sesuai[16]. Skema augmentasi dan normalisasi tersebut berperan dalam mengurangi risiko overfitting, meningkatkan robustnes model terhadap variasi visual, serta membantu model mempelajari representasi fitur jamur yang lebih umum dan tidak terlalu bergantung pada kondisi pencahayaan atau sudut pandang tertentu

Pada tahap preprocessing, seluruh citra jamur terlebih dahulu disesuaikan dengan kebutuhan arsitektur VGG-16 dan ResNet50 agar proses pelatihan berlangsung stabil dan konsisten. Setiap citra di-resize menjadi 224×224 piksel sebagai ukuran standar input model pretrained ImageNet, sehingga seluruh data memiliki dimensi masukan yang seragam dan kompatibel dengan kedua arsitektur tersebut[17]. Setelah itu, dilakukan normalisasi piksel dengan skema yang berbeda untuk masing-masing model: VGG-16 menggunakan normalisasi berbasis nilai mean RGB ImageNet, sedangkan ResNet50 menskalakan nilai piksel ke rentang sekitar −1 hingga 1. Langkah normalisasi ini berperan penting dalam menstabilkan distribusi nilai input, menjaga kestabilan gradien, dan membantu model mencapai konvergensi lebih cepat selama proses pelatihan.

Selain normalisasi, diterapkan juga rangkaian teknik augmentasi data untuk mengatasi variasi pencahayaan, orientasi, dan latar belakang yang cukup tinggi pada dataset jamur. Augmentasi yang digunakan meliputi rotasi acak hingga 25°, pergeseran horizontal dan vertikal sebesar 10%, zoom hingga 25%, penyesuaian tingkat kecerahan dalam rentang 0,7–1,3, perubahan nilai kanal warna (channel shift) sebesar 20, serta horizontal flip untuk mensimulasikan pembalikan arah objek[18]. Transformasi-transformasi ini menghasilkan sampel citra baru yang tetap mempertahankan karakteristik utama jamur, tetapi dengan kombinasi tampilan yang lebih beragam, sehingga model menjadi lebih adaptif terhadap perubahan kondisi visual dunia nyata dan tidak mudah terjebak overfitting pada pola-pola spesifik di data latih.

Dari hasil pengamatan terhadap kurva pelatihan, tahapan preprocessing dan augmentasi memberikan dampak positif yang signifikan terhadap performa model, khususnya pada arsitektur VGG-16 yang menunjukkan pola akurasi dan loss yang lebih stabil dengan selisih (gap) yang kecil antara training dan validation[19]. Kondisi ini mengindikasikan bahwa model mampu belajar dengan baik tanpa terlalu menghafal data latih. Pada ResNet50, preprocessing juga membantu menurunkan training loss dengan cepat, meskipun masih tampak fluktuasi kecil pada kurva validasi akibat sensitivitas jaringan residual terhadap noise dan variasi pencahayaan. Rangkaian preprocessing ini berkontribusi besar dalam meningkatkan kualitas data masukan, sehingga model dapat mempelajari tekstur, warna, dan pola morfologi jamur secara lebih efektif dan robust terhadap variasi citra.

ResNet50 memperkenalkan konsep residual learning melalui residual block yang menggunakan shortcut connection (identity/pintasan) untuk mengalirkan sinyal dan gradien secara langsung melintasi beberapa lapisan, sehingga mengurangi risiko vanishing gradient pada jaringan yang sangat dalam[20]. Intuisi utamanya adalah mempelajari fungsi residu terhadap input, bukan memetakan fungsi target secara absolut sejak awal, sehingga optimisasi menjadi lebih stabil dan cepat konvergen.

Secara matematis, keluaran residual block dirumuskan sebagai:

(3)dengan:

F(x): transformasi nonlinier terhadap x (rangkaian operasi konvolusi, normalisasi, dan aktivasi),

x: shortcut connection yang ditambahkan element-wise pada keluaran F(x).

Apabila dimensi x dan F(x) tidak cocok, shortcut dapat menggunakan proyeksi (misalnya 1×1 convolution) untuk penyelarasan kanal/ukuran, sedangkan pada kasus dimensi yang cocok digunakan identity shortcut. Desain ini memungkinkan blok belajar fungsi identitas saat diperlukan, sehingga degradasi akurasi akibat penambahan kedalaman dapat diminimalkan dan proses konvergensi dilaporkan lebih cepat pada berbagai tugas visi computer [21]

Dalam praktiknya, ResNet50 menyusun residual block dalam beberapa tahap kedalaman dengan bottleneck block (1×1, 3×3, 1×1) agar komputasi efisien tanpa kehilangan kapasitas representasi. Mekanisme penjumlahan shortcut mempertahankan aliran informasi penting dari lapisan awal sekaligus memberi fleksibilitas bagi F(x) untuk mempelajari modifikasi yang relevan pada domain citra jamur. Pendekatan ini menjadikan ResNet50 pilihan kuat untuk transfer learning pada klasifikasi biner edible vs. poisonous, karena stabil pada pelatihan mendalam dan cenderung memiliki generalisasi yang baik pada data dengan variasi visual tinggi [22]

Figure 3. Residual ResNet50

2. Pembangunan Dua Model Deep Learning

Berbeda dengan multilayer perceptron konvensional, CNN memanfaatkan operasi konvolusi untuk mengekstraksi fitur spasial secara lokal dan bertingkat, sehingga mampu mengenali pola visual mulai dari tepi sederhana hingga struktur objek yang kompleks. Pendekatan ini menjadikan CNN sangat efektif untuk tugas klasifikasi citra, deteksi objek, dan segmentasi [23].

Secara matematis, operasi konvolusi dua dimensi antara citra masukan dan sebuah kernel/filter dapat dinyatakan sebagai:

(1) di mana menyatakan citra input, adalah kernel/filter yang belajar mengekstraksi pola tertentu, dan adalah nilai keluaran pada koordinat . Melalui serangkaian kernel yang berbeda, CNN dapat membangun kumpulan feature map yang merepresentasikan berbagai karakteristik visual jamur, seperti kontur tudung, tekstur permukaan, maupun bentuk batang.

Secara umum, arsitektur dasar CNN tersusun atas beberapa komponen utama. Lapisan konvolusi (convolution layer) berperan sebagai ekstraktor fitur dengan menerapkan sejumlah kernel pada citra masukan. Setiap keluaran konvolusi kemudian dilewatkan ke fungsi aktivasi non-linear, seperti Rectified Linear Unit (ReLU), untuk meningkatkan kapasitas representasi model dan mengurangi masalah vanishing gradient. Lapisan pooling (pooling layer), seperti max pooling, digunakan untuk melakukan downsampling secara spasial guna mengurangi dimensi data, meningkatkan invarian terhadap translasi kecil, serta membantu menekan overfitting[24]. Di bagian akhir jaringan, fitur yang telah teragregasi diratakan (flatten) dan dihubungkan ke satu atau beberapa lapisan fully connected yang berfungsi sebagai pengambil keputusan klasifikasi, sebelum akhirnya diteruskan ke output layer (misalnya Softmax) yang menghasilkan probabilitas untuk setiap kelas jamur[25].

Dalam konteks penelitian ini, CNN dimanfaatkan tidak hanya sebagai ekstraktor fitur otomatis, tetapi juga sebagai komponen utama dalam pipeline transfer learning pada arsitektur VGG16 dan ResNet50. Dengan memanfaatkan representasi visual yang telah dipelajari pada dataset berskala besar, model dapat lebih cepat beradaptasi terhadap domain citra jamur dan berpotensi mencapai performa klasifikasi yang tinggi meskipun ukuran dataset relatif terbatas. Pendekatan ini menjadikan CNN sebagai fondasi penting dalam pengembangan sistem klasifikasi jamur berbasis kecerdasan buatan yang akurat dan andal[26]. Arsitektur umum CNN dapat dilihat pada Gambar 4.

Figure 4. Arsitektur CNN

Pada tahap pembangunan model, penelitian ini menggunakan dua arsitektur deep learning berbasis Convolutional Neural Network (CNN), yaitu VGG-16 dan ResNet50, yang keduanya diimplementasikan dengan pendekatan transfer learning menggunakan bobot awal hasil pralatih pada dataset ImageNet. Pendekatan ini dipilih untuk memanfaatkan kemampuan ekstraksi fitur visual yang telah terbentuk pada domain citra berskala besar, sehingga proses adaptasi ke domain citra jamur menjadi lebih efisien dan tetap stabil meskipun ukuran dataset relatif terbatas[18]

VGG-16 merupakan arsitektur CNN dengan 16 lapisan yang dapat dilatih, terdiri atas 13 convolutional layer dan 3 fully connected layer, dengan filter konvolusi berukuran 3×3 yang disusun secara konsisten pada setiap blok konvolusi. Struktur ini membuat VGG-16 efektif dalam mengekstraksi fitur visual bertingkat, mulai dari tepi sederhana hingga pola tekstur kompleks yang sering muncul pada permukaan tudung dan batang jamur. Dalam penelitian ini, VGG-16 dimanfaatkan sebagai feature extractor dengan mempertahankan bagian convolutional base, sementara tiga fully connected layer bawaan digantikan oleh rangkaian layer baru yang dirancang khusus untuk klasifikasi biner (edible vs. poisonous). Setelah tahap awal pelatihan, dilakukan fine-tuning dengan membuka sekitar 10 lapisan terakhir pada backbone VGG-16 sehingga bobot pada lapisan-lapisan tingkat tinggi dapat disesuaikan terhadap karakteristik spesifik dataset jamur yang memiliki variasi warna, tekstur, dan bentuk yang cukup tinggi[22]

Berbeda dengan VGG-16, arsitektur ResNet50 memanfaatkan konsep residual learning melalui penggunaan residual block dengan shortcut connection untuk mengatasi permasalahan vanishing gradient pada jaringan yang sangat dalam. Mekanisme ini memungkinkan informasi dan gradien mengalir lebih langsung melintasi beberapa lapisan, sehingga proses pelatihan tetap stabil meskipun kedalaman jaringan cukup besar. Dalam penelitian ini, ResNet50 juga digunakan sebagai feature extractor dengan mengganti bagian fully connected layer standar menjadi classifier dua kelas yang disesuaikan dengan tugas klasifikasi jamur[13]. Berbeda dengan VGG-16, penyesuaian pada ResNet50 dibatasi pada bagian klasifier saja tanpa melakukan fine-tuning mendalam pada seluruh backbone, sehingga model lebih banyak mengandalkan kekuatan representasi fitur generik yang telah dipelajari dari ImageNet.

Kedua model dilatih menggunakan konfigurasi pelatihan yang seragam agar perbandingan performa menjadi lebih adil. Optimizer yang digunakan adalah Adam dengan learning rate awal 1×10⁻⁴ dan diturunkan menjadi 1×10⁻⁵ pada tahap fine-tuning VGG-16. Ukuran batch ditetapkan sebesar 32, sedangkan fungsi loss yang digunakan adalah Binary Crossentropy dengan label smoothing untuk meningkatkan kemampuan generalisasi pada klasifikasi biner. Proses pelatihan juga dilengkapi dengan mekanisme callback berupa EarlyStopping untuk menghentikan pelatihan ketika tidak terjadi peningkatan performa validasi dalam beberapa epoch, serta ReduceLROnPlateau untuk menurunkan learning rate secara adaptif ketika laju perbaikan performa mulai melambat[12]. Dengan konfigurasi ini, kedua arsitektur dapat dievaluasi dan dibandingkan dari sisi kemampuan ekstraksi fitur, stabilitas proses pelatihan, serta performa akhir dalam membedakan jamur edible dan poisonous.

3. Pelatihan Model

Pelatihan ini dilakukan dalam dua fase untuk VGG-16 dan ResNet50. Hasilnya dapat dilihat pada grafik akurasi dan loss yang disajikan pada Gambar 7.

Figure 5. Grafik Akurasi dan Loss

Hasil pelatihan menunjukkan bahwa pada VGG-16, fase pertama dengan skema training head menghasilkan peningkatan akurasi yang bertahap dan cenderung stabil, dengan penurunan loss yang konsisten dari epoch ke epoch. Ketika tahap fine-tuning pada sekitar 10 lapisan terakhir diaktifkan, laju peningkatan akurasi menjadi lebih cepat dan penurunan loss semakin signifikan, yang mengindikasikan bahwa penyesuaian bobot di lapisan tingkat tinggi efektif dalam menangkap fitur-fitur khusus jamur, seperti variasi tekstur tudung dan pola permukaan. Selisih akurasi antara data pelatihan dan validasi relatif kecil, sehingga model dapat dikatakan tidak mengalami overfitting secara berarti dan memiliki kemampuan generalisasi yang baik terhadap data yang belum pernah dilihat.

Pada ResNet50, performa awal yang dicapai sudah cukup baik bahkan sejak beberapa epoch pertama, dengan penurunan training loss yang cepat sebagai indikasi bahwa arsitektur residual mampu mempelajari pola visual utama secara efisien. Namun, pola akurasi pada data validasi cenderung menunjukkan fluktuasi yang lebih besar dibanding VGG-16, meskipun nilai rata-rata akurasinya kompetitif. Kondisi ini mengisyaratkan bahwa ResNet50 sedikit lebih sensitif terhadap variasi noise, perubahan brightness, dan perbedaan tekstur halus pada dataset jamur, sehingga respons model terhadap sampel validasi menjadi kurang stabil dibanding VGG-16[27]. Secara keseluruhan, VGG-16 memberikan kurva pelatihan yang lebih stabil, sedangkan ResNet50 unggul dalam kecepatan pembelajaran awal namun memerlukan pengaturan regulasi dan augmentasi yang lebih hati-hati untuk mengurangi fluktuasi pada akurasi validasi.

4. Evaluasi Performa Model

Evaluasi kinerja model klasifikasi jamur dilakukan menggunakan beberapa metrik standar pada masalah klasifikasi biner yang diturunkan dari confusion matrix, yaitu True Positive (TP), True Negative (TN), False Positive (FP), dan False Negative (FN). Metrik utama yang digunakan meliputi akurasi, presisi, recall, dan F1-score, yang masing-masing mengukur aspek berbeda dari kualitas prediksi model[28].

Akurasi mengukur proporsi prediksi yang benar terhadap seluruh sampel uji, dirumuskan sebagai:

(4) Presisi mengukur seberapa besar bagian prediksi positif yang benar-benar termasuk kelas positif:

(5) Recall (sensitivitas) menggambarkan kemampuan model dalam menangkap seluruh sampel positif yang sebenarnya:

(6)

Sementara itu, F1-score merupakan rata-rata harmonik antara presisi dan recall, sehingga memberikan ukuran seimbang ketika distribusi kelas tidak seimbang atau ketika biaya kesalahan berbeda:

(7)

Penggunaan kombinasi keempat metrik ini memberikan gambaran yang lebih komprehensif mengenai performa model, tidak hanya dari sisi ketepatan prediksi secara keseluruhan, tetapi juga kemampuan membedakan jamur edible dan poisonous secara lebih detail.

VGG16 merupakan salah satu arsitektur jaringan saraf dalam yang banyak digunakan sebagai backbone pada berbagai tugas klasifikasi citra karena struktur jaringan yang dalam namun teratur. Angka “16” merujuk pada jumlah total layer yang dapat dilatih (trainable layers), terdiri atas kombinasi beberapa convolution layer dan fully connected layer yang disusun secara berurutan[29]. Seluruh lapisan konvolusi pada VGG16 menggunakan filter berukuran 3×3 yang diterapkan secara konsisten, sehingga proses ekstraksi fitur berlangsung secara stabil, terkontrol, dan mudah dianalisis secara komputasional.

Secara umum, jumlah parameter pada lapisan konvolusi VGG16 dapat dimodelkan dengan persamaan

(2) dengan:

: jumlah input channel,

: ukuran filter (kernel),

: jumlah output feature maps.

Formulasi tersebut menggambarkan besarnya kompleksitas model yang bergantung pada dimensi kernel, banyaknya saluran masukan, dan jumlah fitur keluaran yang ingin dipelajari pada setiap lapisan.

Dalam penelitian ini, VGG16 dimanfaatkan sebagai feature extractor utama. Seluruh bobot pralatih pada bagian convolutional base dipertahankan untuk memanfaatkan pengetahuan representasional yang telah diperoleh dari dataset berskala besar, sedangkan bagian fully connected layer bawaan digantikan dengan rangkaian layer baru yang dirancang khusus untuk klasifikasi biner jamur edible dan poisonous[30]. Tahap finetuning dilakukan dengan membuka (mengatur sebagai trainable) sejumlah layer terakhir pada backbone, misalnya 10 lapisan teratas, sehingga jaringan dapat menyesuaikan fitur tingkat tinggi dengan karakteristik spesifik citra jamur[31]. Strategi ini memungkinkan tercapainya keseimbangan antara pemanfaatan transfer learning dan kemampuan adaptasi terhadap domain baru, sekaligus mengendalikan risiko overfitting pada ukuran dataset yang terbatas.

Figure 6. Arsitektur VGG-16

Arsitektur VGG-16 merupakan salah satu model Convolutional Neural Network (CNN) yang dirancang untuk melakukan ekstraksi fitur visual secara mendalam dengan tetap mempertahankan struktur jaringan yang relatif sederhana dan teratur. Model ini terdiri atas 16 lapisan yang dapat dilatih, yang mencakup 13 convolutional layer dan 3 fully connected layer, sehingga mampu membangun representasi hierarkis dari citra mulai dari fitur tingkat rendah hingga tinggi. Seluruh convolutional layer menggunakan filter berukuran kecil 3×3 dengan stride 1 dan padding “same”, sehingga resolusi spasial peta fitur terjaga dan detail visual dapat ditangkap secara bertahap pada setiap blok konvolusi[32]. Setiap lapisan konvolusi diikuti oleh fungsi aktivasi ReLU untuk memperkenalkan non-linearitas, mempercepat proses pembelajaran, dan membantu mengurangi permasalahan vanishing gradient selama pelatihan.

Setelah beberapa blok konvolusi, VGG-16 menggunakan operasi max pooling berukuran 2×2 untuk mereduksi dimensi spasial peta fitur sekaligus mempertahankan informasi yang paling dominan, sehingga beban komputasi menurun tanpa menghilangkan karakteristik utama objek. Hasil ekstraksi fitur dari seluruh blok konvolusi kemudian diratakan (flatten) dan diteruskan ke tiga lapisan fully connected yang berfungsi sebagai lapisan klasifikasi tingkat tinggi. Pada bagian akhir, digunakan fungsi aktivasi softmax untuk menghasilkan distribusi probabilitas terhadap kelas keluaran yang ditetapkan. Dalam konteks penelitian klasifikasi jamur dua kelas, arsitektur ini umumnya dimanfaatkan sebagai backbone atau feature extractor, sedangkan lapisan fully connected bawaan diganti dengan lapisan klasifikasi baru yang disesuaikan dengan jumlah kelas target[33]. Pendekatan ini memungkinkan VGG-16 mempertahankan kekuatannya dalam ekstraksi fitur visual sambil beradaptasi dengan domain spesifik citra jamur.

Pengujian dilakukan menggunakan data test yang tidak pernah digunakan selama pelatihan. Hasil performa kedua model adalah sebagai berikut:

Tabel 2. Hasil Akurasi Model

Hasil evaluasi menunjukkan bahwa VGG-16 memberikan performa yang lebih unggul dibandingkan ResNet50 pada tugas klasifikasi jamur edible dan poisonous. Akurasi sebesar 96% mengindikasikan bahwa VGG-16 mampu mengklasifikasikan sebagian besar citra jamur dengan benar, dengan tingkat kesalahan yang relatif kecil pada kedua kelas[34]. Sebaliknya, ResNet50 masih menghasilkan lebih banyak mis-klasifikasi, terutama pada kelas edible, yang menunjukkan bahwa model ini kurang stabil dalam membedakan beberapa sampel edible yang secara visual mirip dengan sampel poisonous[35].

Analisis lebih rinci menggunakan confusion matrix memperlihatkan distribusi prediksi benar dan salah untuk masing-masing kelas, sehingga dapat diidentifikasi pola kesalahan yang dominan, misalnya edible yang sering diprediksi sebagai poisonous atau sebaliknya[36]. Informasi ini penting untuk memahami keterbatasan model, mengevaluasi keseimbangan sensitivitas terhadap masing-masing kelas, serta menjadi dasar perbaikan lebih lanjut, misalnya melalui penyesuaian threshold, penambahan data latih untuk kelas tertentu, atau modifikasi strategi augmentasi agar fitur pembeda antara kedua kelas dapat dipelajari secara lebih jelas oleh model.

Figure 7. Confusion Matrix

Confusion matrix untuk model VGG-16 menunjukkan bahwa 12 sampel jamur edible berhasil diprediksi dengan benar sebagai edible dan 12 sampel jamur poisonous diprediksi dengan benar sebagai poisonous, dengan hanya 1 sampel yang salah klasifikasi pada salah satu kelas[37]. Pola prediksi yang hampir sempurna ini mengindikasikan bahwa VGG-16 memiliki stabilitas yang sangat baik dalam membedakan kedua kelas, serta mampu menangkap fitur-fitur pembeda utama antara jamur edible dan poisonous secara konsisten.

Sementara itu, confusion matrix untuk ResNet50 memperlihatkan bahwa 10 sampel jamur edible diprediksi dengan benar sebagai edible dan 13 sampel jamur poisonous diprediksi dengan benar sebagai poisonous, namun terdapat 2 sampel edible yang salah diklasifikasikan. Kesalahan ini menunjukkan bahwa bagi ResNet50, karakteristik visual jamur edible relatif lebih sulit dikenali dibandingkan VGG-16, terutama ketika fitur warna, tekstur, atau bentuknya menyerupai jamur poisonous[38]. Tabel evaluasi yang disusun dari classification report (precision, recall, dan F1-score per kelas) memperjelas perbedaan ini, di mana VGG-16 umumnya memiliki nilai metrik yang lebih tinggi dan seimbang di kedua kelas, sedangkan ResNet50 cenderung menunjukkan penurunan nilai terutama pada kelas edible, menguatkan temuan bahwa VGG-16 lebih andal untuk skenario klasifikasi jamur pada dataset ini.

Tabel evaluasi berdasarkan classfication report menunjukkan perbedaan performa antar model.

Tabel 3. Hasil Evaluasi Model

VGG-16 menunjukkan kinerja yang seimbang pada kedua kelas dengan nilai precision dan recall yang relatif simetris, sehingga model tidak cenderung memihak salah satu kelas dan mampu mendeteksi jamur edible maupun poisonous secara konsisten. Sebaliknya, ResNet50 memiliki precision yang tinggi pada kelas edible namun recall yang lebih rendah, yang berarti masih terdapat sejumlah sampel edible yang gagal terdeteksi dan diprediksi sebagai kelas lain. Untuk kelas poisonous, recall ResNet50 mencapai 1,00 yang menunjukkan bahwa seluruh sampel poisonous berhasil terdeteksi, tetapi precision-nya rendah sehingga terdapat cukup banyak sampel edible yang keliru diklasifikasikan sebagai poisonous[39]

Selain metrik berbasis confusion matrix dan classification report, kemampuan diskriminatif model juga dianalisis menggunakan kurva ROC (Receiver Operating Characteristic). Nilai AUC (Area Under Curve) yang diperoleh untuk kedua model adalah 1,000, yang secara teoritis menunjukkan kemampuan klasifikasi sempurna dalam membedakan antara jamur edible dan poisonous pada data uji yang digunakan. Nilai AUC tersebut mengindikasikan bahwa, meskipun pola kesalahan dan distribusi precision–recall berbeda antara VGG-16 dan ResNet50, keduanya tetap memiliki kemampuan yang sangat kuat dalam memisahkan dua kelas pada skenario pengujian saat ini[35]

Figure 8. ROC

5. Analisis Hasil

Seluruh hasil evaluasi menunjukkan bahwa setiap tahap dalam alur penelitian berkontribusi langsung terhadap peningkatan performa model klasifikasi jamur. Tahap preprocessing, khususnya normalisasi dan augmentasi citra, terbukti meningkatkan stabilitas proses pelatihan, yang tercermin dari selisih akurasi train–validation yang kecil pada VGG-16 dan tren loss yang tidak menunjukkan indikasi overfitting yang signifikan. Hal ini mengindikasikan bahwa model mampu mempelajari pola visual jamur secara efektif tanpa terlalu “menghafal” data latih.

Perbandingan dua arsitektur deep learning memperlihatkan bahwa VGG-16 lebih sesuai untuk karakteristik dataset jamur yang digunakan. Penggunaan filter 3×3 secara konsisten memungkinkan penangkapan pola tekstur halus dan variasi warna pada permukaan jamur dengan lebih detail, sehingga mendukung kinerja yang stabil pada kedua kelas. Di sisi lain, ResNet50 meskipun kuat secara teoritis, masih menunjukkan fluktuasi kinerja terutama pada kelas edible, yang mengisyaratkan bahwa arsitektur residual kurang optimal ketika jumlah data relatif terbatas dan variasi intra-kelas tinggi.

Ditinjau dari metrik akurasi, precision, recall, dan F1-score, VGG-16 menghasilkan nilai yang lebih seimbang untuk kelas edible dan poisonous, sehingga memberikan performa yang lebih andal secara keseluruhan. Keseimbangan ini penting dalam konteks aplikasi nyata, karena kesalahan pada salah satu kelas (terutama salah mengklasifikasikan poisonous sebagai edible) dapat berimplikasi serius. Dengan demikian, pada konfigurasi dan dataset yang digunakan dalam penelitian ini, VGG-16 dapat disimpulkan sebagai model paling optimal untuk tugas klasifikasi jamur edible dan poisonous.

Simpulan

Penelitian ini menunjukkan bahwa penerapan Convolutional Neural Network (CNN) dengan arsitektur VGG-16 dan ResNet50 mampu melakukan klasifikasi citra jamur beracun (poisonous) dan jamur dapat dimakan (edible) dengan tingkat akurasi yang tinggi. Model VGG-16 dengan skema transfer learning dan fine-tuning menghasilkan akurasi uji sebesar 96% dengan nilai loss 0,1671, sedangkan ResNet50 tanpa fine-tuning memperoleh akurasi uji sebesar 92% dengan loss 0,2991. Hasil ini menegaskan bahwa pemanfaatan bobot pralatih ImageNet melalui transfer learning berperan penting dalam meningkatkan kemampuan model mengenali fitur kompleks pada citra jamur, khususnya ketika jumlah dataset relatif terbatas.

Secara arsitektural, VGG-16 terbukti lebih unggul dibandingkan ResNet50 pada dataset jamur ini dari sisi stabilitas pelatihan dan kemampuan generalisasi. Susunan filter konvolusi berukuran 3×3 yang konsisten memungkinkan VGG-16 menangkap pola tekstur halus dan variasi warna permukaan jamur dengan lebih efektif, sehingga menghasilkan nilai akurasi, precision, recall, dan F1-score yang lebih seimbang pada kedua kelas. ResNet50 tetap menunjukkan performa yang kompetitif berkat mekanisme residual learning yang menjaga kestabilan gradien pada jaringan dalam, namun masih memperlihatkan fluktuasi kinerja yang lebih besar, terutama pada kelas edible.

Model yang dihasilkan memiliki potensi untuk dikembangkan lebih lanjut sebagai sistem identifikasi jamur otomatis berbasis kecerdasan buatan, yang dapat dimanfaatkan oleh masyarakat umum, petani, maupun peneliti untuk membantu membedakan jenis jamur secara lebih cepat dan akurat. Untuk penelitian selanjutnya, disarankan untuk memperluas jumlah dan keragaman dataset, mengeksplorasi arsitektur CNN lain seperti InceptionV3, EfficientNet, atau model vision transformer, serta melakukan optimasi hiperparameter yang lebih sistematis agar diperoleh performa klasifikasi yang lebih optimal dan efisien pada berbagai skenario penggunaan.

References

Batubara, G. M. C., Desiani, A., and Amran, A., “Classification of Poisonous Mushrooms Using Naïve Bayes and K-Nearest Neighbors,” Journal of Computer Science and Informatics, vol. 3, no. 1, pp. 33–42, 2023, doi: 10.54082/jiki.68.

Harneni, L., Jauhari, C. K., Hia, R. R., Pideksa, N. K., Musthofa, M. A., Hendriyadi, M. Z., Aldrian N., Rizal, M., Lestari, M., and Septiani, N. W. P., “Classification of Edible Mushrooms Based on Image Using Pre-Trained Inception V3 Model,” Journal of Applied Computational Engineering, vol. 4, no. 2, pp. 169–176, 2024, doi: 10.30998/jrkt.v4i02.11132.

Raup, A., Ridwan, W., Khoeriyah, Y., Supiana, S., and Zaqiah, Q. Y., “Deep Learning and Its Applications in Education,” Journal of Educational Sciences, 2022. [Online]. Available: http://www.jiip.stkipyapisdompu.ac.id/jiip/index.php/JIIP/article/view/805

Syuhada, R., Analysis of VGG Deep Learning Architecture for Mushroom Classification, Master’s thesis, Universitas Medan Area, Medan, Indonesia, 2023.

Hasan, M. A., Riyanto, Y., and Riana, D., “Grape Leaf Disease Classification Using CNN-VGG16 Model,” Journal of Computer Systems Technology, vol. 9, no. 4, pp. 218–223, 2021, doi: 10.14710/jtsiskom.2021.14013.

Widyan, I. I. A., Implementation of VGG-19 CNN Architecture for Salak Fruit Image Classification, Master’s thesis, Universitas Islam Indonesia, Yogyakarta, Indonesia, 2024.

Santoso, I., Manurung, A. M., and Subhiyakto, E. R., “Comparison of ResNet-50, EfficientNet-B1, and VGG-16 for Cataract Image Classification,” Journal of Applied Informatics and Computing, vol. 9, no. 2, pp. 284–294, 2025, doi: 10.30871/jaic.v9i2.8968.

Irvanizam, I., Subianto, M., and Jamil, M. S., “A Convolutional Neural Network Model for Mushroom Toxicity Recognition,” Infolitika Journal of Data Science, 2022. [Online]. Available: https://heca-analitika.com/ijds/article/view/359

Putra, I. P., and Hermawan, R., “Identification of Poisonous Mushroom Clitocybe sp. in Gresik, Indonesia,” Media of Health Research and Development, vol. 31, no. 2, pp. 119–124, 2021, doi: 10.22435/mpk.v31i2.4352.

Hastuti, S., Ansar, A., and Hermawan, N., “Application of Deep Learning Technology in Digital Education,” Journal of Indonesian Educational Research, vol. 4, no. 2, pp. 359–365, 2025, doi: 10.31004/jpion.v4i2.376.

Prasetyo, Y., Fatih, M. F. A., Iqbal An Zida, M. J., Isnan, M., and Rizki, A. M., “Comparison Analysis of SGD and Adam Optimizers for Edible and Poisonous Mushroom CNN Classification,” Journal of Informatics Engineering Students, vol. 9, no. 1, pp. 1348–1354, 2024, doi: 10.36040/jati.v9i1.12659.

Berliani, T., Rahardja, E., and Septiana, L., “Comparison of Lung X-Ray Image Classification Using ResNet-50 and VGG-16 Transfer Learning,” Journal of Medicine and Health, vol. 5, no. 2, pp. 123–135, 2023, doi: 10.28932/jmh.v5i2.6116.

Imaduddin, A. R., and Suharsono, T. N., “Mobile-Based Mushroom Image Classification Using CNN,” Innovative Journal of Social Science Research, vol. 3, no. 5, pp. 864–875, 2023.

Office, I. H., Arifuddin, R., and Hidayatulail, B. F., “Pneumonia Classification Using Convolutional Neural Network,” Techne Journal of Electrical Engineering, vol. 23, no. 2, pp. 233–244, 2024, doi: 10.31358/techne.v23i2.491.

Rozaqi, A. J., Arief, M. R., and Sunyoto, A., “Transfer Learning Implementation for Potato Leaf Disease Identification,” Procedia of Engineering and Life Science, vol. 1, no. 1, 2021, doi: 10.21070/pels.v1i1.820.

Mardianto, P. S., Classification of Brain Tumor Types Using CNN With VGG-16 Architecture, Undergraduate thesis, Soegijapranata Catholic University, Semarang, Indonesia, 2025.

Sinaga, L. M. P., Red Chili Disease Classification Using VGG19 Model, Master’s thesis, Universitas Medan Area, Medan, Indonesia, 2025.

Dengen, C. S., and Muhammad, A. H., “ResNet-50 Transfer Learning for Tomato Leaf Disease Classification,” Journal of Scientific Research and Informatics Education, vol. 10, no. 4, pp. 3907–3914, 2025, doi: 10.29100/jipi.v10i4.7191.

Farisya, C. F., Plant Leaf Disease Detection Using VGG19 With CBAM Attention Mechanism, Master’s thesis, Universitas Medan Area, Medan, Indonesia, 2025.

Kristiaji, F., ResNet-50 CNN for Citrus Plant Disease Classification, Undergraduate thesis, Universitas Amikom Purwokerto, Purwokerto, Indonesia, 2024.

Khani, N. I., and Rakasiwi, S., “ResNet-50 CNN for Facial Skin Disease Classification,” Edumatic Journal of Informatics Education, vol. 9, no. 1, pp. 217–225, 2025, doi: 10.29408/edumatic.v9i1.29572.

Rozi, M. I. F., Adiwijaya, N. O., and Swasono, D. I., “Performance Evaluation of VGG16, ResNet-50, and Inception-V3 for Tomato Leaf Disease Classification,” Journal of Electrical Engineering Research, vol. 5, no. 2, pp. 145–154, 2023, doi: 10.30595/jrre.v5i2.18050.

Sheila, S., Sari, I. P., Saputra, A. B., Anwar, M. K., and Pujianto, F. R., “Rice Leaf Disease Detection Using CNN-Based Image Processing,” Multinetics Journal, vol. 9, no. 1, pp. 27–34, 2023, doi: 10.32722/multinetics.v9i1.5255.

Gaho, R. L., Ali, I. T., and Prakasa, E., “Road Surface Quality Classification Using Xception-Based CNN,” INOVTEK Polbeng Informatics Series, vol. 9, no. 1, 2024, doi: 10.35314/isi.v9i1.4213.

Adelia, D., Fitri, Z., and Agusniar, C., “Herbal and Poisonous Leaf Detection Using Convolutional Neural Network,” Rabit Journal of Technology and Information Systems, 2025.

Irjanto, N. S., Kiswanto, R. H., Sabra, I. S., and Rahman, F., “Computer Vision-Based Skin Disease Recognition Using CNN,” Techno.com Journal, vol. 23, no. 3, 2024, doi: 10.62411/tc.v23i3.11355.

Pranatha, M. D., Maricar, M. A., and Setiawan, G. H., “ResNet-34 Architecture for Potato Leaf Disease Image Classification,” Journal of Business Information Systems, vol. 6, no. 3, pp. 575–580, 2024, doi: 10.47233/jteksis.v6i3.1431.

Widyaya, J. E., and Budi, S., “Effect of Preprocessing on Diabetic Retinopathy Classification Using CNN Transfer Learning,” Journal of Informatics Engineering and Information Systems, vol. 7, no. 1, 2021, doi: 10.28932/jutisi.v7i1.3327.

Fernandes, D. R., and Rachmat, N., “Non-Destructive Sweetness Classification of Watermelon Using VGG-16 Transfer Learning,” Journal of Applied Industrial Technology and Management, vol. 4, no. 4, pp. 1330–1339, 2025, doi: 10.55826/81wv2s06.

Siddik, A. M. A., “Transfer Learning Performance Comparison for Hand Sign Digit Classification,” Journal of Mathematics, Statistics, and Computation, vol. 20, no. 1, pp. 75–89, 2023, doi: 10.20956/j.v20i1.26503.

Barat, A. I. R. H., Astuti, W. S., Wanto, A., and Solikhun, S., “VGG16 Transfer Learning Optimization for Corn Leaf Disease Detection,” Bulletin of Computer Science Research, vol. 5, no. 5, pp. 1049–1058, 2025, doi: 10.47065/bulletincsr.v5i5.631.

Evansyah, E. B., and Aditya, C. S. K., “Comparison of VGG16 and VGG19 Models for Down Syndrome Image Classification,” INOVTEK Polbeng Informatics Series, vol. 10, no. 2, pp. 922–933, 2025, doi: 10.35314/pz35e881.

Murinto, M., Rosyda, M., and Melany, M., “Coffee Bean Type Classification Using CNN and Transfer Learning,” Journal of Science and Technology Research, vol. 7, no. 2, pp. 183–189, 2023, doi: 10.30595/jrst.v7i2.16788.

Afkar, A. N. D., Rachmad, A., and Rochman, E. M. S., “Pneumonia Classification Using Convolutional Neural Network,” Journal of Informatics Engineering Students, vol. 9, no. 4, pp. 5821–5828, 2025, doi: 10.36040/jati.v9i4.13938.

Wijaya, A. E., Swastika, W., and Kelana, O. H., “CNN Transfer Learning for COVID-19 and Pneumonia Diagnosis Using X-Ray Images,” Sainsbertek Journal of Science and Technology, vol. 2, no. 1, pp. 10–15, 2021, doi: 10.33479/sb.v2i1.125.

Wulandari, S. K., and Jasmir, J., “ResNet-50 for Freshwater Fish Disease Detection in Aquaculture,” Proceedings of SENABISTEKES, vol. 1, no. 1, pp. 17–24, 2024.

Agus, I. P., Hidjah, K., Sulistianingsih, N., Hendro, G., and Syahrir, S., “Deep CNN Architecture With Transfer Learning for Skin Disease Classification,” Journal of Information Technology and Multimedia, vol. 7, no. 3, pp. 461–477, 2025, doi: 10.35746/jtim.v7i3.734.

Febriana, B., Apple Leaf Disease Identification Using ResNet-50 Dilated CNN, Undergraduate thesis, Institut Teknologi Nasional Bandung, Bandung, Indonesia, 2020.

Ramadhan, A. S., Rahmawati, Y., Astutik, I. R. I., and Sumarno, “Durian Leaf Disease Identification Using ResNet-50 Algorithm,” Infotek Journal of Informatics and Technology, vol. 8, no. 2, pp. 435–446, 2025, doi: 10.29408/jit.v8i2.30293.