Vision Transformer untuk Klasifikasi Kematangan Pisang

Produksi pisang di Indonesia pada tahun 2022 mencapai 9,6 juta ton buah. Metode konvensional yang digunakan untuk menentukan tingkat kematangan pisang masih mengandalkan indera penglihatan manusia dengan memperhatikan perubahan warna kulit pisang. Namun, penentuan tingkat kematangan pisang dengan m...

Full description

Saved in:
Bibliographic Details
Main Authors: Arya Pangestu, Bedy Purnama, Risnandar Risnandar
Format: Article
Language:Indonesian
Published: University of Brawijaya 2024-02-01
Series:Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:https://jtiik.ub.ac.id/index.php/jtiik/article/view/7389
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1823858602569367552
author Arya Pangestu
Bedy Purnama
Risnandar Risnandar
author_facet Arya Pangestu
Bedy Purnama
Risnandar Risnandar
author_sort Arya Pangestu
collection DOAJ
description Produksi pisang di Indonesia pada tahun 2022 mencapai 9,6 juta ton buah. Metode konvensional yang digunakan untuk menentukan tingkat kematangan pisang masih mengandalkan indera penglihatan manusia dengan memperhatikan perubahan warna kulit pisang. Namun, penentuan tingkat kematangan pisang dengan metode ini memiliki beberapa kekurangan, seperti waktu yang lama, penilaian yang bersifat subjektif dan dapat menghasilkan hasil yang berbeda-beda bagi setiap individu. Oleh karena itu, teknologi computer vision dapat menjadi solusi yang efektif dalam mengklasifikasikan kematangan buah pisang secara otomatis. Penelitian ini menggunakan metodologi Vision Transformer (ViT) untuk mengklasifikasikan tingkat kematangan pada buah pisang, dengan tingkatan yang dibagi menjadi empat kategori, yaitu mentah, setengah matang, matang, dan terlalu matang. Penelitian dilakukan dengan menggunakan lima model ViT yang sudah dilatih sebelumnya atau pre-trained, yaitu ViT-B/16, ViT-B/32, ViT-L/16, ViT-L/32, and ViT-H/14 pada ImageNet-21k dan ImageNet-1k. Kemudian, model ViT tersebut dievaluasi dan dibandingkan dengan model CNN. Evaluasi dilakukan menggunakan metode cross-dataset dengan 5.068 citra pisang yang berbeda dari dataset latih. Hasil evaluasi menunjukkan model ViTL/16-in21k memiliki akurasi tertinggi sebesar 91,61%. Model ViT menunjukkan kemampuan generalisasi yang lebih baik, sementara CNN memiliki ukuran model dan waktu pelatihan yang lebih efisien.
format Article
id doaj-art-15093f861644424494ab2e20d71af7be
institution Kabale University
issn 2355-7699
2528-6579
language Indonesian
publishDate 2024-02-01
publisher University of Brawijaya
record_format Article
series Jurnal Teknologi Informasi dan Ilmu Komputer
spelling doaj-art-15093f861644424494ab2e20d71af7be2025-02-11T10:38:20ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792024-02-0111110.25126/jtiik.20241117389Vision Transformer untuk Klasifikasi Kematangan PisangArya Pangestu0Bedy Purnama1Risnandar Risnandar2Fakultas Informatika, Universitas Telkom, BandungFakultas Informatika, Universitas Telkom, BandungFakultas Informatika, Universitas Telkom, Bandung Produksi pisang di Indonesia pada tahun 2022 mencapai 9,6 juta ton buah. Metode konvensional yang digunakan untuk menentukan tingkat kematangan pisang masih mengandalkan indera penglihatan manusia dengan memperhatikan perubahan warna kulit pisang. Namun, penentuan tingkat kematangan pisang dengan metode ini memiliki beberapa kekurangan, seperti waktu yang lama, penilaian yang bersifat subjektif dan dapat menghasilkan hasil yang berbeda-beda bagi setiap individu. Oleh karena itu, teknologi computer vision dapat menjadi solusi yang efektif dalam mengklasifikasikan kematangan buah pisang secara otomatis. Penelitian ini menggunakan metodologi Vision Transformer (ViT) untuk mengklasifikasikan tingkat kematangan pada buah pisang, dengan tingkatan yang dibagi menjadi empat kategori, yaitu mentah, setengah matang, matang, dan terlalu matang. Penelitian dilakukan dengan menggunakan lima model ViT yang sudah dilatih sebelumnya atau pre-trained, yaitu ViT-B/16, ViT-B/32, ViT-L/16, ViT-L/32, and ViT-H/14 pada ImageNet-21k dan ImageNet-1k. Kemudian, model ViT tersebut dievaluasi dan dibandingkan dengan model CNN. Evaluasi dilakukan menggunakan metode cross-dataset dengan 5.068 citra pisang yang berbeda dari dataset latih. Hasil evaluasi menunjukkan model ViTL/16-in21k memiliki akurasi tertinggi sebesar 91,61%. Model ViT menunjukkan kemampuan generalisasi yang lebih baik, sementara CNN memiliki ukuran model dan waktu pelatihan yang lebih efisien. https://jtiik.ub.ac.id/index.php/jtiik/article/view/7389
spellingShingle Arya Pangestu
Bedy Purnama
Risnandar Risnandar
Vision Transformer untuk Klasifikasi Kematangan Pisang
Jurnal Teknologi Informasi dan Ilmu Komputer
title Vision Transformer untuk Klasifikasi Kematangan Pisang
title_full Vision Transformer untuk Klasifikasi Kematangan Pisang
title_fullStr Vision Transformer untuk Klasifikasi Kematangan Pisang
title_full_unstemmed Vision Transformer untuk Klasifikasi Kematangan Pisang
title_short Vision Transformer untuk Klasifikasi Kematangan Pisang
title_sort vision transformer untuk klasifikasi kematangan pisang
url https://jtiik.ub.ac.id/index.php/jtiik/article/view/7389
work_keys_str_mv AT aryapangestu visiontransformeruntukklasifikasikematanganpisang
AT bedypurnama visiontransformeruntukklasifikasikematanganpisang
AT risnandarrisnandar visiontransformeruntukklasifikasikematanganpisang