Komparasi Teknik Klasifikasi Teks Mining Pada Analisis Sentimen

Joang Ipmawati, Kusrini ., Emha Taufiq Luthfi - STMIK AMIKOM Yogyakarta

Abstract


Abstract - Opininion mining also called sentiment analysis is a computational research of opinions, sentiments and emotions that are textually to see opinion on an issue, or to identify the tendency of things in the market. This time public opinion be an important resource in making decisions for a product. Classification algorithm to perform text mining including Support Vector Machine (SVM), Naïve Bayessian classification (NBC) and K-Nearest Neighbor (K-NN). These of algorithms will compired to find out a good performance in terms of accuracy for two different datasets that imdb movie reviews and twitter sentiment. The results of the comparison showed SVM obtain good results in accuracy in the data imdb movie reviews 78.55% and on twitter dataset 72%. Similarly, NBC obtained the data accuracy at 78.55% twitter but different data twitter 67.33%. The results of F-Measure SVM movie review show and NBC showed the same results, namely 0.785 and also for the AUC, the results surpass NBC 0.869, SVM get results 0.786 and while KNN obtain the results 0.572. F-Measure to twitter SVM is superior obtaining results of 0.720 and 0.673 NBC obtained results while K-NN 0.545. and for the results of the AUC, as dataset imdb, on twitter this dataset NBC also outperformed SVM and K-NN. AUC to obtain results NBC 0.735, SVM obtain results K-NN 0.658 and 0.618 get results.
Keywords : Text Mining, Sentiment Analysis, SVM, Naïve Bayessian, K-NN, compare, comparation

Abstrak - Opininion mining juga disebut analisis sentimen adalah riset komputasional dari opini, sentimen dan emosi yang diekspresikan secara tekstual dilakukan untuk melihat pendapat terhadap sebuah masalah, atau untuk identifikasi kecenderungan hal di pasar. Saat ini pendapat masyarakat menjadi sumber yang penting dalam pengambilan keputusan akan suatu produk. Algoritma klasifikasi yang dapat melakukan teks mining diantaranya Support Vector Machine (SVM), Naïve Bayessian classification (NBC) dan K-Nearest Neighbor (K-NN). Ketiga algoritma ini akan dikomparasi untuk mengetahui performa yang baik dalam hal akurasi untuk dua dataset yang berbeda yaitu imdb review film dan sentimen twitter. Hasil dari komparasi menunjukkan SVM memperoleh hasil yang baik dalam akurasi pada data imdb review film 78,55% dan pada dataset twitter 72%. Sama halnya dengan NBC yang memperoleh akurasi pada data twitter 78.55% tetapi berbeda pada data twitter 67,33%. Hasil F-Measure review film menunjukan SVM dan NBC memperoleh hasil yang sama yaitu 0,785 dan untuk hasil AUC, NBC mengungguli hasil 0,869, SVM memperoleh hasil 0,786 sedangkan KNN memperoleh hasil 0,572. F-Measure untuk twitter SVM lebih unggul memperoleh hasil 0,720 dan NBC memperoleh hasil 0,673 sedangkan K-NN 0,545. Dan untuk hasil AUC, sama seperti dataset imdb, pada dataset twitter ini NBC juga mengungguli SVM dan K-NN. AUC untuk NBC memperoleh hasil 0,735, SVM memperoleh hasil 0,658 dan K-NN memperoleh hasil 0,618.
Kata kunci: teks mining, sentimen analisis, SVM, Naïve Bayessian, K-NN, komparasi

Full Text:

Untitled

References


Ling, J., Kencana, I.P.K., Oka, B.O., Analisis Sentimen Menggunakan Metode Naïve Bayes Classifier Dengan Seleksi Fitur Chi Square, E-Jurnal Matematika, ISSN: 2303-1751, Vol. 3 (3), Agustus 2014, pp. 92-99 ISSN: 2303-1751

Patil, G., Galande, V., Kekan, V., Dange, K., 2014, Sentiment Analysis Using Support Vector Machine, International Journal of Innovative Research in Computer and Communication Engineering, ISSN(Online): 2320-9801,ISSN (Print): 2320-9798, Vol. 2, Issue 1, January 2014

Bijalwan, V., Kumar, V., Kumari,P.,Pascual, J., KNN based Machine Learning Approach for Text and Document Mining, International Journal of Database Theory and Application Vol.7, No.1 (2014), pp.61-70, 2014

Aulianita, R., Komparasi Metode K-Nearest Neighbors dan Support Vector Machine Pada Sentiment Analysis Review Kamera, Journal Speed Sentra Penelitian Engineering dan Edukasi Volume 8 No 3, 2016

Chandani, V., Wahono, R.S., Purwanto, Komparasi Algoritma Klasifikasi Machine Learning Dan Feature Selection pada Analisis Sentimen Review Film, Journal of Intelligent Systems,ISSN 2356-3982, Vol. 1, No. 1, February 2015

Dan, L., Lihua, L., Zhaoxin, Z., Research Of Text Categorization On WEKA, 2013 Third International Conference on Intelligent System Design and Engineering Applications, 2013

Falahah, Nur, D.D.A., Pengembangan Aplikasi Sentiment Analysis Menggunakan Metode Naïve Bayes (Studi Kasus Sentiment Analysis dari media Twitter), Seminar Nasional Sistem Informasi Indonesia, 2-3 November 2015

Hamzah, A., Klasifikasi Teks Dengan Naïve Bayes Classifier (NBC) Untuk Pengelompokan Teks Berita Dan Abstract Akademis, Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST), ISSN:1979-911X, Nopember 2012

Lidya, S.K., Sitompul, O.S., Efendi, S., Sentiment Analysis Pada Teks Bahasa Indonesia Menggunakan Support Vector Machine (SVM) Dan K-Nearest Neighbor (K-NN), Seminar Nasional Teknologi Informasi dan Komunikasi 2015 (SENTIKA 2015) ISSN: 2089-9815, 28 Maret 2015

Muthia, D.A., Opinion Mining Pada Review Buku Menggunakan Algoritma Naïve Bayes, Jurnal Teknik Komputer Amik Bsi Vol.II No.1 Februari 2016

Rozi, I.F., Pramono, S.H., Dahlan, E.A., Implementasi Opinion Mining (Analisis Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi, Jurnal EECCIS Vol. 6, No. 1, Juni 2012

Saputra, N., Adji, T.B., Permanasari, A.E., Analisis Sentimen Data Presiden Jokowi Dengan Preprocessing Normalisasi Dan Stemming Menggunakan Metode Naive Bayes Dan Svm, Jurnal Dinamika Informatika, Volume 5, Nomor 1, November 2015

Saraswati, N.W.S., Naïve Bayes Classifier Dan Support Vector Machines Untuk Sentiment Analysis, Seminar Nasional Sistem Informasi Indonesia, 2 - 4 Desember 2013

Trstenjak, B., Mikac,S., Donko, D., KNN with TF-IDF Based Framework for Text Categorization, 24th DAAAM International Symposium on Intelligent Manufacturing and Automation, 2013

Utami, L.D., Wahono, R.S., Integrasi Metode Information Gain Untuk Seleksi Fitur dan Adaboost Untuk Mengurangi Bias Pada Analisis Sentimen Review Restoran Menggunakan Algoritma Naïve Bayes, Journal of Intelligent Systems,ISSN 2356-3982, Vol. 1, No. 2, December 2015

Purwanti, E., Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour, e-ISSN 2442-5168 Volume 1, Nomor 2, Juli-Desember 2015

Waila, P., Marisha, Singh, V.K., Singh, M.K., Evaluating Machine Learning and Unsupervised Semantic Orientation Approaches for Sentiment Analysis of Textual Reviews, IEEE International Conference on Computational Intelligence and Computing Research, 2012

Wahyuni, E.S., Penerapan Metode Seleksi Fitur Untuk Meningkatkan Hasil Diagnosis Kanker Payudara, ISSN: 2252-4983, Jurnal SIMETRIS, Vol 7 No 1 April 2016

Younis, E.M.G., Sentment Analysis and Text Mining For Social Media Microblog using Open Source Tools: An Empirical Study, International Journal of Computer Application (0975-8887), Volume 112 – No. 5, February 2015

Chiwara, M., Al-Ayyoub, M., Sajjad, M., Gupta, H.R., Wasilewska, A., 24 mei 2016, Text Mining, http://www3.cs.stonybrook.edu/~cse634/presentations/ TextMining.pdf

Go, A., Bhayani,R., Huang, L., Agustus 2016, Twitter Sentiment Classification using Distant Supervision, http://cs.stanford.edu/people/alecmgo/papers/ TwitterDistant Supervision09.pdf

Liu, Bing, 31 Mei 2016, Sentiment Analysis And Opinion Mining. Chicago: Morgan & Claypool Publisher, http://www.dcc.ufrj.br/~valeriab/ DTMSentiment-AnalysisAndOpinionMining-BingLiu.pdf.

Mouthami,K., Devi, K.N., Bhaskaran, M., Agustus 2016, Sentiment Analysis and Classification BasedOn Textual Reviews, http://ieeexplore.ieee.org /

Pang, B., & Lee, L., September 2016, A Sentimental Education : Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts. Association for Computational Linguistics, http://dl.acm.org/citation.cfm?id=1218990

Waila, P., Marisha, Singh, M.K., and Singh, M.K., Agustus 2016, Evaluating Machine Learning and Unsupervised Semantic Orientation Approaches for Sentiment Analysis of Textual Reviews, http:// ieeexplore.ieee.org/

http://help.sentiment140.com/for-students/ diunduh bulan September 2016




DOI: http://dx.doi.org/10.55181/ijns.v6i1.1444

Refbacks

  • There are currently no refbacks.


IJNS - Indonesian Journal on Networking and Security - ISSN: 2302-5700 (Print) 2354-6654 (Online)

Global Impact Factor 2012 : 0.345, 2013 : 0.412 - Universal Impact Factor  2014 : 0.12769 - SJIF – Scientific Journal Impact Factor 2012 : 4.074 - Google Scholar h5 Index: 20, h5 Median: 29