Vision Transformer untuk Klasifikasi Kematangan Pisang
Produksi pisang di Indonesia pada tahun 2022 mencapai 9,6 juta ton buah. Metode konvensional yang digunakan untuk menentukan tingkat kematangan pisang masih mengandalkan indera penglihatan manusia dengan memperhatikan perubahan warna kulit pisang. Namun, penentuan tingkat kematangan pisang dengan m...
Saved in:
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Indonesian |
Published: |
University of Brawijaya
2024-02-01
|
Series: | Jurnal Teknologi Informasi dan Ilmu Komputer |
Online Access: | https://jtiik.ub.ac.id/index.php/jtiik/article/view/7389 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
_version_ | 1823858602569367552 |
---|---|
author | Arya Pangestu Bedy Purnama Risnandar Risnandar |
author_facet | Arya Pangestu Bedy Purnama Risnandar Risnandar |
author_sort | Arya Pangestu |
collection | DOAJ |
description |
Produksi pisang di Indonesia pada tahun 2022 mencapai 9,6 juta ton buah. Metode konvensional yang digunakan untuk menentukan tingkat kematangan pisang masih mengandalkan indera penglihatan manusia dengan memperhatikan perubahan warna kulit pisang. Namun, penentuan tingkat kematangan pisang dengan metode ini memiliki beberapa kekurangan, seperti waktu yang lama, penilaian yang bersifat subjektif dan dapat menghasilkan hasil yang berbeda-beda bagi setiap individu. Oleh karena itu, teknologi computer vision dapat menjadi solusi yang efektif dalam mengklasifikasikan kematangan buah pisang secara otomatis. Penelitian ini menggunakan metodologi Vision Transformer (ViT) untuk mengklasifikasikan tingkat kematangan pada buah pisang, dengan tingkatan yang dibagi menjadi empat kategori, yaitu mentah, setengah matang, matang, dan terlalu matang. Penelitian dilakukan dengan menggunakan lima model ViT yang sudah dilatih sebelumnya atau pre-trained, yaitu ViT-B/16, ViT-B/32, ViT-L/16, ViT-L/32, and ViT-H/14 pada ImageNet-21k dan ImageNet-1k. Kemudian, model ViT tersebut dievaluasi dan dibandingkan dengan model CNN. Evaluasi dilakukan menggunakan metode cross-dataset dengan 5.068 citra pisang yang berbeda dari dataset latih. Hasil evaluasi menunjukkan model ViTL/16-in21k memiliki akurasi tertinggi sebesar 91,61%. Model ViT menunjukkan kemampuan generalisasi yang lebih baik, sementara CNN memiliki ukuran model dan waktu pelatihan yang lebih efisien.
|
format | Article |
id | doaj-art-15093f861644424494ab2e20d71af7be |
institution | Kabale University |
issn | 2355-7699 2528-6579 |
language | Indonesian |
publishDate | 2024-02-01 |
publisher | University of Brawijaya |
record_format | Article |
series | Jurnal Teknologi Informasi dan Ilmu Komputer |
spelling | doaj-art-15093f861644424494ab2e20d71af7be2025-02-11T10:38:20ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792024-02-0111110.25126/jtiik.20241117389Vision Transformer untuk Klasifikasi Kematangan PisangArya Pangestu0Bedy Purnama1Risnandar Risnandar2Fakultas Informatika, Universitas Telkom, BandungFakultas Informatika, Universitas Telkom, BandungFakultas Informatika, Universitas Telkom, Bandung Produksi pisang di Indonesia pada tahun 2022 mencapai 9,6 juta ton buah. Metode konvensional yang digunakan untuk menentukan tingkat kematangan pisang masih mengandalkan indera penglihatan manusia dengan memperhatikan perubahan warna kulit pisang. Namun, penentuan tingkat kematangan pisang dengan metode ini memiliki beberapa kekurangan, seperti waktu yang lama, penilaian yang bersifat subjektif dan dapat menghasilkan hasil yang berbeda-beda bagi setiap individu. Oleh karena itu, teknologi computer vision dapat menjadi solusi yang efektif dalam mengklasifikasikan kematangan buah pisang secara otomatis. Penelitian ini menggunakan metodologi Vision Transformer (ViT) untuk mengklasifikasikan tingkat kematangan pada buah pisang, dengan tingkatan yang dibagi menjadi empat kategori, yaitu mentah, setengah matang, matang, dan terlalu matang. Penelitian dilakukan dengan menggunakan lima model ViT yang sudah dilatih sebelumnya atau pre-trained, yaitu ViT-B/16, ViT-B/32, ViT-L/16, ViT-L/32, and ViT-H/14 pada ImageNet-21k dan ImageNet-1k. Kemudian, model ViT tersebut dievaluasi dan dibandingkan dengan model CNN. Evaluasi dilakukan menggunakan metode cross-dataset dengan 5.068 citra pisang yang berbeda dari dataset latih. Hasil evaluasi menunjukkan model ViTL/16-in21k memiliki akurasi tertinggi sebesar 91,61%. Model ViT menunjukkan kemampuan generalisasi yang lebih baik, sementara CNN memiliki ukuran model dan waktu pelatihan yang lebih efisien. https://jtiik.ub.ac.id/index.php/jtiik/article/view/7389 |
spellingShingle | Arya Pangestu Bedy Purnama Risnandar Risnandar Vision Transformer untuk Klasifikasi Kematangan Pisang Jurnal Teknologi Informasi dan Ilmu Komputer |
title | Vision Transformer untuk Klasifikasi Kematangan Pisang |
title_full | Vision Transformer untuk Klasifikasi Kematangan Pisang |
title_fullStr | Vision Transformer untuk Klasifikasi Kematangan Pisang |
title_full_unstemmed | Vision Transformer untuk Klasifikasi Kematangan Pisang |
title_short | Vision Transformer untuk Klasifikasi Kematangan Pisang |
title_sort | vision transformer untuk klasifikasi kematangan pisang |
url | https://jtiik.ub.ac.id/index.php/jtiik/article/view/7389 |
work_keys_str_mv | AT aryapangestu visiontransformeruntukklasifikasikematanganpisang AT bedypurnama visiontransformeruntukklasifikasikematanganpisang AT risnandarrisnandar visiontransformeruntukklasifikasikematanganpisang |