Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)

Stopword Removal merupakan bagian dari tahapan preprocessing teks yang bertujuan untuk menghapus kata yang tidak relevan didalam suatu kalimat berdasarkan daftar stopword. Daftar stopword yang biasa digunakan berbentuk digital library yang daftarnya sudah tersedia sebelumnya, namun tidak semua kata...

Full description

Saved in:

Bibliographic Details
Main Authors:	Raditya Rinandyaswara, Yuita Arum Sari, Muhammad Tanzil Furqon
Format:	Article
Language:	Indonesian
Published:	University of Brawijaya 2022-08-01
Series:	Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:	https://jtiik.ub.ac.id/index.php/jtiik/article/view/4707
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1823858557278224384
author	Raditya Rinandyaswara Yuita Arum Sari Muhammad Tanzil Furqon
author_facet	Raditya Rinandyaswara Yuita Arum Sari Muhammad Tanzil Furqon
author_sort	Raditya Rinandyaswara
collection	DOAJ
description	Stopword Removal merupakan bagian dari tahapan preprocessing teks yang bertujuan untuk menghapus kata yang tidak relevan didalam suatu kalimat berdasarkan daftar stopword. Daftar stopword yang biasa digunakan berbentuk digital library yang daftarnya sudah tersedia sebelumnya, namun tidak semua kata-kata yang terdapat didalam digital library merupakan kata yang tidak relevan dalam suatu data tertentu. Penelitian ini menggunakan daftar stopword yang dibentuk dengan algoritme Term Based Random Sampling. Dalam Term Based Random Sampling terdapat 3 parameter yaitu Y untuk jumlah perulangan pengambilan kata random, X untuk jumlah pengambilan bobot terendah dalam perulangan Y, dan L sebagai persentase jumlah stopword yang ingin digunakan. Sehingga penelitian ini ditujukan untuk mencari kombinasi terbaik dari 3 parameter tersebut serta membandingkan stopword Term Based Random Sampling dengan stopword Tala dan tanpa proses stopword removal dalam analisis sentimen tweet mengenai kuliah daring dengan menggunakan metode Naïve Bayes. Hasil evaluasi dengan stopword Term Based Random Sampling mendapatkan akurasi tertinggi dengan X, Y, L sebesar 10, 10, 40 dengan macroaverage accuracy sebesar 0,758, macroaverage precision sebesar 0,658, macroaverage recall sebesar 0,636, dan macroaverage f-measure sebesar 0,647. Berdasarkan hasil pengujian disimpulkan bahwa semakin besar X, Y, L maka semakin tinggi kemungkinannya untuk hasil evaluasi turun. Hasil pengujian membuktikan bahwa Term Based Random Sampling berhasil mendapatkan akurasi lebih tinggi dibandingkan dengan stopword Tala maupun tanpa menggunakan proses stopword removal. Abstract Stopword Removal is part of the text preprocessing stage which aims to remove irrelevant words in a sentence based on the stopword list. The stopword list that is commonly used is in the form of a digital library whose list is already available, but not all words contained in the digital library are irrelevant words in certain data. This study uses a stopword list formed by the Term Based Random Sampling algorithm. In Term Based Random Sampling, there are 3 parameters, namely Y for the number of random word retrieval repetitions, X for the lowest number of weights in Y repetitions, and L as the percentage of the number of stopwords you want to use. So this research is aimed at finding the best combination of these 3 parameters and comparing the Term Based Random Sampling stopword with the stopword tuning and without the stopword removal process in the analysis of tweet sentiment regarding online lectures using the Naïve Bayes method. The results of the evaluation with the Term Based Random Sampling stopword get the highest accuracy with X, Y, L of 10, 10, 40 with a macroaverage accuracy of 0.758, a macroaverage precision of 0.658, a macroaverage recall of 0.636, and a macroaverage f-measure of 0.647. Based on the test results, it is concluded that the greater the X, Y, L, the higher the probability that the evaluation results will decrease. The test results prove that Term Based Random Sampling is successful in obtaining higher accuracy than stopword tuning or without using the stopword removal process.
format	Article
id	doaj-art-75570f5bf63142aba189613bc084cac9
institution	Kabale University
issn	2355-7699 2528-6579
language	Indonesian
publishDate	2022-08-01
publisher	University of Brawijaya
record_format	Article
series	Jurnal Teknologi Informasi dan Ilmu Komputer
spelling	doaj-art-75570f5bf63142aba189613bc084cac92025-02-11T10:42:29ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792022-08-019410.25126/jtiik.2022934707971Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)Raditya Rinandyaswara0Yuita Arum Sari1Muhammad Tanzil Furqon2Universitas Brawijaya, MalangUniversitas Brawijaya, MalangUniversitas Brawijaya, Malang Stopword Removal merupakan bagian dari tahapan preprocessing teks yang bertujuan untuk menghapus kata yang tidak relevan didalam suatu kalimat berdasarkan daftar stopword. Daftar stopword yang biasa digunakan berbentuk digital library yang daftarnya sudah tersedia sebelumnya, namun tidak semua kata-kata yang terdapat didalam digital library merupakan kata yang tidak relevan dalam suatu data tertentu. Penelitian ini menggunakan daftar stopword yang dibentuk dengan algoritme Term Based Random Sampling. Dalam Term Based Random Sampling terdapat 3 parameter yaitu Y untuk jumlah perulangan pengambilan kata random, X untuk jumlah pengambilan bobot terendah dalam perulangan Y, dan L sebagai persentase jumlah stopword yang ingin digunakan. Sehingga penelitian ini ditujukan untuk mencari kombinasi terbaik dari 3 parameter tersebut serta membandingkan stopword Term Based Random Sampling dengan stopword Tala dan tanpa proses stopword removal dalam analisis sentimen tweet mengenai kuliah daring dengan menggunakan metode Naïve Bayes. Hasil evaluasi dengan stopword Term Based Random Sampling mendapatkan akurasi tertinggi dengan X, Y, L sebesar 10, 10, 40 dengan macroaverage accuracy sebesar 0,758, macroaverage precision sebesar 0,658, macroaverage recall sebesar 0,636, dan macroaverage f-measure sebesar 0,647. Berdasarkan hasil pengujian disimpulkan bahwa semakin besar X, Y, L maka semakin tinggi kemungkinannya untuk hasil evaluasi turun. Hasil pengujian membuktikan bahwa Term Based Random Sampling berhasil mendapatkan akurasi lebih tinggi dibandingkan dengan stopword Tala maupun tanpa menggunakan proses stopword removal. Abstract Stopword Removal is part of the text preprocessing stage which aims to remove irrelevant words in a sentence based on the stopword list. The stopword list that is commonly used is in the form of a digital library whose list is already available, but not all words contained in the digital library are irrelevant words in certain data. This study uses a stopword list formed by the Term Based Random Sampling algorithm. In Term Based Random Sampling, there are 3 parameters, namely Y for the number of random word retrieval repetitions, X for the lowest number of weights in Y repetitions, and L as the percentage of the number of stopwords you want to use. So this research is aimed at finding the best combination of these 3 parameters and comparing the Term Based Random Sampling stopword with the stopword tuning and without the stopword removal process in the analysis of tweet sentiment regarding online lectures using the Naïve Bayes method. The results of the evaluation with the Term Based Random Sampling stopword get the highest accuracy with X, Y, L of 10, 10, 40 with a macroaverage accuracy of 0.758, a macroaverage precision of 0.658, a macroaverage recall of 0.636, and a macroaverage f-measure of 0.647. Based on the test results, it is concluded that the greater the X, Y, L, the higher the probability that the evaluation results will decrease. The test results prove that Term Based Random Sampling is successful in obtaining higher accuracy than stopword tuning or without using the stopword removal process. https://jtiik.ub.ac.id/index.php/jtiik/article/view/4707
spellingShingle	Raditya Rinandyaswara Yuita Arum Sari Muhammad Tanzil Furqon Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi) Jurnal Teknologi Informasi dan Ilmu Komputer
title	Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)
title_full	Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)
title_fullStr	Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)
title_full_unstemmed	Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)
title_short	Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)
title_sort	pembentukan daftar stopword menggunakan term based random sampling pada analisis sentimen dengan metode naive bayes studi kasus kuliah daring di masa pandemi
url	https://jtiik.ub.ac.id/index.php/jtiik/article/view/4707
work_keys_str_mv	AT radityarinandyaswara pembentukandaftarstopwordmenggunakantermbasedrandomsamplingpadaanalisissentimendenganmetodenaivebayesstudikasuskuliahdaringdimasapandemi AT yuitaarumsari pembentukandaftarstopwordmenggunakantermbasedrandomsamplingpadaanalisissentimendenganmetodenaivebayesstudikasuskuliahdaringdimasapandemi AT muhammadtanzilfurqon pembentukandaftarstopwordmenggunakantermbasedrandomsamplingpadaanalisissentimendenganmetodenaivebayesstudikasuskuliahdaringdimasapandemi

Pembentukan Daftar Stopword Menggunakan Term Based Random Sampling Pada Analisis Sentimen Dengan Metode Naïve Bayes (Studi Kasus: Kuliah Daring Di Masa Pandemi)

Similar Items