Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)

Kemudahan memperoleh informasi saat ini telah banyak membantu manusia, salah satu mencari ulasan untuk tempat makan baru. Pencarian ulasan ini dipicu karena pengunjung tidak mengetahui layanan dari tempat tersebut. Ulasan juga dapat menguntungkan penjual, karena mereka mengetahui pengalaman yang di...

Full description

Saved in:

Bibliographic Details
Main Authors:	Aisyah Awalina, Fitra Abdurrachman Bachtiar, Indriati Indriati
Format:	Article
Language:	Indonesian
Published:	University of Brawijaya 2022-02-01
Series:	Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:	https://jtiik.ub.ac.id/index.php/jtiik/article/view/5692
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1823858596673224704
author	Aisyah Awalina Fitra Abdurrachman Bachtiar Indriati Indriati
author_facet	Aisyah Awalina Fitra Abdurrachman Bachtiar Indriati Indriati
author_sort	Aisyah Awalina
collection	DOAJ
description	Kemudahan memperoleh informasi saat ini telah banyak membantu manusia, salah satu mencari ulasan untuk tempat makan baru. Pencarian ulasan ini dipicu karena pengunjung tidak mengetahui layanan dari tempat tersebut. Ulasan juga dapat menguntungkan penjual, karena mereka mengetahui pengalaman yang dimiliki pengunjungnya. Oleh karena itu, ulasan palsu dimanfaatkan banyak orang untuk membuat ulasan palsu. Ulasan palsu bisa secara efektif dibedakan menggunakan machine learning. Namun, banyak dari dataset ulasan palsu ini tidak seimbang (imbalanced dataset) sehingga dapat mempengaruhi hasil klasifikasi. Oleh karena itu, penelitian ini menggunakan metode BOS untuk mengatasi tidak seimbangnya data dan melakukan klasifikasi dengan metode SVM. Adapun tahapan dari penelitian yaitu preprocessing, lalu pembobotan kata dengan TF-IDF dan fitur sentimen menggunakan lexicon-based features, dilanjutkan proses menyeimbangkan dataset dengan BOS, setelah itu proses klasifikasi oleh SVM. Adapun langkah dalam pengujian BOS dan SVM yaitu pembagian data latih dan uji dengan 80%:20%, setelah itu pencarian parameter terbaik pada data latih dengan 5-fold cross validation, dan dievaluasi dengan data uji. Adapun nilai parameter terbaik pada BOS dan SVM yaitu N dengan nilai 400% dimana hasil evaluasi akurasi dengan nilai 78,6%; precision dengan nilai 19,7%; recall dengan nilai 17,1%; f-measure dengan nilai 14,4%; dan g-mean dengan nilai 32%. Oleh karena itu, penggunaan BOS dapat meningkatkan hasil evaluasi dari terhadap klasifikasi ulasan palsu. Abstract The convenience of obtaining information nowadays has helped many people such as looking for reviews for new places to eat. The search for reviews was triggered because visitors were not aware of the services of the place. Reviews can also benefit sellers, because they know the experience their visitors have had. Therefore, many people abuse reviews to create spam reviews. Spam reviews can be effectively resolved using machine learning. However, many of these spam review datasets are imbalanced and thus may affect classification results. In this study, BOS algorithm was used to overcome data imbalances, and SVM algorithm for the classification of spam reviews. The stages of the research are preprocessing, then weighting words with TF-IDF and sentiment features using lexicon-based features, followed by the process of balancing the dataset with BOS, and classification process with SVM. Step in testing BOS and SVM are split data of training and test data with 80%:20%, after that the search for the best parameters in the training data with 5-fold cross-validation, and evaluated with test data. The best parameter values for BOS and SVM were N with a value of 400% where the results of the accuracy evaluation were 78.6%; precision with a value of 19.7%; recall with a value of 17.1%; f-measure with a value of 14.4%; and g-mean with a value of 32%. Therefore, use of BOS can improve the evaluation results from the classification of spam reviews.
format	Article
id	doaj-art-fa57d13433db4de79ed928233027067d
institution	Kabale University
issn	2355-7699 2528-6579
language	Indonesian
publishDate	2022-02-01
publisher	University of Brawijaya
record_format	Article
series	Jurnal Teknologi Informasi dan Ilmu Komputer
spelling	doaj-art-fa57d13433db4de79ed928233027067d2025-02-11T10:42:52ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792022-02-019210.25126/jtiik.2022925692910Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)Aisyah Awalina0Fitra Abdurrachman Bachtiar1Indriati Indriati2Universitas Brawijaya, MalangUniversitas Brawijaya, MalangUniversitas Brawijaya, Malang Kemudahan memperoleh informasi saat ini telah banyak membantu manusia, salah satu mencari ulasan untuk tempat makan baru. Pencarian ulasan ini dipicu karena pengunjung tidak mengetahui layanan dari tempat tersebut. Ulasan juga dapat menguntungkan penjual, karena mereka mengetahui pengalaman yang dimiliki pengunjungnya. Oleh karena itu, ulasan palsu dimanfaatkan banyak orang untuk membuat ulasan palsu. Ulasan palsu bisa secara efektif dibedakan menggunakan machine learning. Namun, banyak dari dataset ulasan palsu ini tidak seimbang (imbalanced dataset) sehingga dapat mempengaruhi hasil klasifikasi. Oleh karena itu, penelitian ini menggunakan metode BOS untuk mengatasi tidak seimbangnya data dan melakukan klasifikasi dengan metode SVM. Adapun tahapan dari penelitian yaitu preprocessing, lalu pembobotan kata dengan TF-IDF dan fitur sentimen menggunakan lexicon-based features, dilanjutkan proses menyeimbangkan dataset dengan BOS, setelah itu proses klasifikasi oleh SVM. Adapun langkah dalam pengujian BOS dan SVM yaitu pembagian data latih dan uji dengan 80%:20%, setelah itu pencarian parameter terbaik pada data latih dengan 5-fold cross validation, dan dievaluasi dengan data uji. Adapun nilai parameter terbaik pada BOS dan SVM yaitu N dengan nilai 400% dimana hasil evaluasi akurasi dengan nilai 78,6%; precision dengan nilai 19,7%; recall dengan nilai 17,1%; f-measure dengan nilai 14,4%; dan g-mean dengan nilai 32%. Oleh karena itu, penggunaan BOS dapat meningkatkan hasil evaluasi dari terhadap klasifikasi ulasan palsu. Abstract The convenience of obtaining information nowadays has helped many people such as looking for reviews for new places to eat. The search for reviews was triggered because visitors were not aware of the services of the place. Reviews can also benefit sellers, because they know the experience their visitors have had. Therefore, many people abuse reviews to create spam reviews. Spam reviews can be effectively resolved using machine learning. However, many of these spam review datasets are imbalanced and thus may affect classification results. In this study, BOS algorithm was used to overcome data imbalances, and SVM algorithm for the classification of spam reviews. The stages of the research are preprocessing, then weighting words with TF-IDF and sentiment features using lexicon-based features, followed by the process of balancing the dataset with BOS, and classification process with SVM. Step in testing BOS and SVM are split data of training and test data with 80%:20%, after that the search for the best parameters in the training data with 5-fold cross-validation, and evaluated with test data. The best parameter values for BOS and SVM were N with a value of 400% where the results of the accuracy evaluation were 78.6%; precision with a value of 19.7%; recall with a value of 17.1%; f-measure with a value of 14.4%; and g-mean with a value of 32%. Therefore, use of BOS can improve the evaluation results from the classification of spam reviews. https://jtiik.ub.ac.id/index.php/jtiik/article/view/5692
spellingShingle	Aisyah Awalina Fitra Abdurrachman Bachtiar Indriati Indriati Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan) Jurnal Teknologi Informasi dan Ilmu Komputer
title	Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)
title_full	Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)
title_fullStr	Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)
title_full_unstemmed	Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)
title_short	Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)
title_sort	klasifikasi ulasan palsu menggunakan borderline over sampling bos dan support vector machine svm studi kasus ulasan tempat makan
url	https://jtiik.ub.ac.id/index.php/jtiik/article/view/5692
work_keys_str_mv	AT aisyahawalina klasifikasiulasanpalsumenggunakanborderlineoversamplingbosdansupportvectormachinesvmstudikasusulasantempatmakan AT fitraabdurrachmanbachtiar klasifikasiulasanpalsumenggunakanborderlineoversamplingbosdansupportvectormachinesvmstudikasusulasantempatmakan AT indriatiindriati klasifikasiulasanpalsumenggunakanborderlineoversamplingbosdansupportvectormachinesvmstudikasusulasantempatmakan

Klasifikasi Ulasan Palsu Menggunakan Borderline Over Sampling (BOS) dan Support Vector Machine (SVM) (Studi Kasus : Ulasan Tempat Makan)

Similar Items