Waraney Vincent Beckham Wahani (1), Alfiansyah Hasibuan (2), Medi Hermanto Tinambunan (3)
General Background Social media comments offer valuable data for analyzing public discourse on policy issues. Specific Background This study investigates YouTube comments about Danantara, Indonesia's strategic investment body, using Natural Language Processing with 7,294 comments. Knowledge Gap Previous studies often analyze sentiment and topics separately, without integrated analysis or iterative labeling. Aims The study aims to classify sentiment using Support Vector Machine (SVM) and identify topics with Latent Dirichlet Allocation (LDA). Results 74.9% accuracy was achieved with SVM, classifying 58.0% of comments as negative, 29.3% neutral, and 12.8% positive. LDA revealed 6 topics for neutral, 4 for positive, and 3 for negative sentiment, with key concerns about transparency and corruption. Novelty This study integrates SVM and LDA with Human in the Loop labeling to capture both sentiment and topic substance. Implications Findings offer insights for improving transparency and public communication, while contributing to text mining in digital discourse.
• The classifier achieved 74.9% accuracy after Human in the Loop labeling and manual verification.• Unfavorable polarity reached 58.0%, followed by neutral at 29.3% and positive at 12.8%.• Coherence scores selected 6 neutral, 4 positive, and 3 critical thematic clusters.
Danantara; Sentiment Analysis; Topic Modeling; Support Vector Machine; Latent Dirichlet Allocation
Perkembangan teknologi informasi telah mendorong media sosial menjadi ruang diskursus publik digital. YouTube tidak hanya berfungsi sebagai platform berbagi video, tetapi juga menyediakan kolom komentar yang memungkinkan pengguna menyampaikan opini secara langsung terhadap suatu isu. Komentar-komentar tersebut merepresentasikan persepsi publik dan menghasilkan data teks dalam jumlah besar yang bersifat tidak terstruktur[1].
Danantara adalah lembaga investasi strategis pemerintah untuk mengoptimalkan asset negara dan mendorong pertumbuhan ekonomi [2]. Kehadirannya memicu beragam respons publik di YouTube terkait transparansi dan dampak ekonomi.
Karakter komentra yang besar dan informal membuat analisis manual tidak eifisien, sehingga diperlukan pendekatan text mining dan Natural Language Processing (NLP) untuk analisis sitematis [3].
Analisis sentimen telah banyak digunakan untuk mengidentifikasi kecenderungan opini publik pada media sosial terhadap suatu isu atau kebijakan. Di sisi lain, pemodelan topik dimanfaatkan untuk mengungkap tema-tema utama yang berkembang dalam kumpulan teks tidak terstruktur. Kedua pendekatan tersebut memiliki fokus analisis yang berbeda namun saling melengkapi. Analisis sentimen memberikan gambaran mengenai arah opini, sedangkan pemodelan topik membantu mengidentifikasi substansi atau isu yang dibahas[2],[3]. Oleh karena itu, penggabungan kedua pendekatan dalam satu kerangka analisis dapat memberikan pemahaman yang lebih komprehensif terhadap pola diskursus publik dalam ruang digital.
Analisis sentimen dalam penelitian ini dilakukan menggunakan Support Vector Machine (SVM), yaitu algoritma supervised learning yang bekerja dengan mencari hyperplane optimal untuk memisahkan data ke dalam kelas tertentu berdasarkan margin maksimum[4]. SVM dikenal efektif dalam klasifikasi teks karena mampu menangani data berdimensi tinggi dan bersifat sparse, seperti representasi fitur berbasis TF-IDF[4]. Untuk melengkapi analisis polaritas opini, penelitian ini juga menerapkan pemodelan topik menggunakan Latent Dirichlet Allocation (LDA)[5], sebuah metode unsupervised learning berbasis probabilistik yang memodelkan setiap dokumen sebagai distribusi atas sejumlah topik laten dan setiap topik sebagai distribusi probabilitas kata[6].
Meskipun berbagai penelitian sebelumnya telah mengkaji analisis sentimen maupun pemodelan topik secara terpisah, masih terdapat keterbatasan dalam mengintegrasikan kedua pendekatan tersebut secara simultan pada konteks isu kebijakan publik di Indonesia, khususnya yang bersumber dari data komentar YouTube. Selain itu, sebagian penelitian masih bergantung pada pelabelan data secara otomatis atau sepenuhnya manual tanpa mekanisme validasi iteratif, sehingga berpotensi menurunkan kualitas hasil klasifikasi.
Penelitian ini menghadirkan kebaruan melalui integrasi SVM dan LDA untuk analisis sentiment dan topik sceara terpadu, serta penggunaan Human in the Loop guna meningkatkan akurasi pelabelan. Focus pada Danantara juga menjadi kontribusi kontekstual, mengingat kajian perspesi publik terkait kebijakan investasi pemerintah di media social masih terbatas.
A.Tahap Penelitian
Penelitian ini meliputi pengumpulan dan pelabelan komentar YouTube terkait Sanantara, praproses teks, pembobotan TF-IDF, analisis menggunakan SVM dan LDA, serta tahap evaluasi. Alur penelitian disajikan pada Gambar 1.
Gambar . Tahapan Penelitian
B.Pengumpulan Data
Penelitian ini menggunakan data sekunder berupa komentar pengguna YouTube pada tayangan terkait Danantara. Data dikumpulkan melalui proses scraping menggunakan YouTube Data API dari delapan video yang telah ditentukan berdasarkan relevansi konten terhadap isu Danantara. Data yang akan dikumpulkan berupa teks komentar.
C. Preprocesing Teks
Preprocessing merupakan tahap awal yang mencakup serangkaian teknik untuk membersihkan dan menyiapkan data mentah sebelum proses analisis atau pemodelan. Tahap ini bertujuan meningkatkan kualitas data dengan mengurangi artefak atau noise tertentu sehingga hasil prediksi menjadi lebih akurat[7]. Berikut langkah-langkah pada tahap ini :
1.Case Folding
Mengubah seluruh huruf dalam teks menjadi huruf kecil untuk menyeragamkan format penulisan dan menghindari duplikasi kata akibat perbedaan kapitalisasi.
2.Data Cleaning
Menghapus karakter non-alfabet, tanda baca, angka, URL, serta simbol yang tidak relevan agar teks lebih bersih dan siap diproses.
3.Tokenization
Memecah teks menjadi unit-unit kata (token) berdasarkan spasi atau delimiter tertentu sehingga setiap kata dapat dianalisis secara individual.
4.Normalisasi Kata
Mengubah kata tidak baku, singkatan, dan bahasa slang yang umum digunakan dalam komentar YouTube menjadi bentuk baku untuk mengurangi variasi kosakata dengan makna serupa.
5. Stopword Removal
Menghapus kata-kata umum yang memiliki nilai informasi rendah, seperti kata hubung dan kata depan, agar analisis lebih fokus pada kata yang informatif.
D.Support Vector Machine
Support Vector Machine (SVM) adalah metode supervised learning yang efektif untuk klasifikasi data teks kompleks [10]. Penelitian ini menggunakan kernel linear dengan parameter C bernilai 1. SVM bekerja dengan menemukan hyperlane optimal sebagai pemisah terbaik antar kelas data [11], sehingga mampu membedakan dua kelompok secara efektif [12],[13].
E. Latent Dirichlet Allocation
Latent Dirichlet Allocation (LDA) merupakan Teknik pemodelan topik yang digunakan untuk menemukan pola dalam Kumpulan dokumen, sehingga dokumen dapat dikelompokkan secara otomatis ke dalam beberapa topik berbeda [14],[15].
A. Pengumpulan Data
Pengumpulan data dilakukan melalui proses scraping menggunakan YouTube Data API yang dijalankan pada platform Google Colab. Scraping dilakukan terhadap komentar pengguna pada delapan video YouTube yang membahas Danantara. Data yang diperoleh kemudian disimpan dalam format CSV untuk proses analisis lebih lanjut. Total data yang berhasil dikumpulkan sebanyak 7.294 komentar. Dalam penelitian ini, atribut yang digunakan adalah teks komentar sebagai objek utama analisis.
Pelabelan dilakukan dengan pendekatan Human in the Loop pada 5.000 komentar menggunakan Gemini 2.5 Flash dan diverifikasi manual. Hasilnya didominasi sentiment negatif (3.260), diikuti netral (1.047) dan positif (693), yang mencerminkan kondisi opini publik saat pengambilan sampel acak. Selanjutnya, seluruh dataset tersebut dialokasikan ke dalam data latih dan data uji dengan rasio pembagian 80:20, di mana 80% (4.000 data) digunakan untuk melatih algoritma dan 20% (1.000 data) sisanya digunakan untuk mengevaluasi performa model klasifikasi sentimen yang dihasilkan. Tabel 1 menampilkan sampel data mentah yang telah melalui proses pelabelan manual.
Tabel 1 . Sampel data mentah dan label
B. Prepocessing Teks
Untuk menghasilkan data yang bersih dan konsisten sebelum masuk ke tahap klasifikasi SVM dan pemodelan topik LDA, dilakukan lima tahap preprocessing dan hasilnya dapat dilihat pada Tabel 2.
Tabel 2. Hasil Preprocessing Data
Setelah prapemrosesan, teks yang telah bersih diubah ke bentuk numerik agar dapat diproses algoritma, menggunakan metode Term Frequency Inverse Document Frequency (TF-IDF). Metode ini tidak hanya menghitung frekuensi kemunculan sebuah kata dalam satu komentar (Term Frequency), tetapi juga mempertimbangkan seberapa penting atau unik kata tersebut di dalam seluruh dataset (Inverse Document Frequency)[8]. Kata-kata yang terlalu umum akan diberikan bobot rendah, sementara kata kunci yang kuat seperti "korupsi", "untung", atau "aman" akan diberikan bobot yang lebih tinggi untuk membantu proses klasifikasi.
C. Klasifikasi dengan Support Vector Machine
Data hasil ekstraksi fitur kemudian dimasukkan ke model Support Vector Machine (SVM) dengan kernel linear (atau RBF). SVM mengklasifikasikan data dengan menentukan hyperplane optimal untuk memisahkan tiga sentiment: positif, negatif, dan netral.
Evaluasi dilakukan menggunakan confusion matrix untuk membandingkan data actual dan prediksi, menghasilkan nilai TN, FP, FN, dan TP, yang digunakan menghitung akurasi, presisi, recall, dan F1 score [17]. Implementasi menggunakan sklearn dan metrics, dengan hasul ditampilkan pada gambar 2.
Gambar 2. Confusion Matrix
Berdasarkan hasil pengujian menggunakan Confusion Matrix, model klasifikasi Support Vector Machine (SVM) yang dikembangkan berhasil mencapai nilai akurasi sebesar 74,9%. Angka ini menunjukkan bahwa model secara fungsional telah memiliki kemampuan yang reliabel dalam memetakan opini publik mengenai isu Danantara.
Performa terbaik terlihat pada sentiment negatif, dengan 547 dari 652 sata berhasil diprediksi benar (Precision 0.85; Recall 0,84), menunjukkan kemampuan tinggi dalam menangkap pola kritik dan kekhawatiran. Kesalahan klasifikasi tergolong rendah, dengan 82 data terbaca netral dan 23 positif.
Pada sentiment positif, model cukup akurat dengan precision 0,66 dan recall 0,63, meski masih dipengaruhi kemiripan diksi. Sementara itu, pada kelas netral, 114 dari 209 data terklasifikasi benar, sedangkan 72 data keliru sebagai akibat ambiguisitas Bahasa pada komentar informatif.
Hal ini merupakan implikasi dari fenomena distribusi data di mana sentimen Negatif (support: 652) jauh lebih mendominasi dataset dibandingkan kelas Netral (209) dan Positif (139). Secara sosiologis, hal ini merefleksikan dinamika audiens YouTube yang cenderung lebih vokal dalam menyampaikan kritik dan kewaspadaan terhadap kebijakan pengelolaan investasi besar, sehingga model mendapatkan lebih banyak referensi pembelajaran pada pola kalimat negatif dibandingkan pola kalimat apresiatif atau netral.
Temuan ini sejalan dengan studi sebelumnya bahwa SVM stabil dan efektif untuk klasifikasi teks media social. Berbeda dari penelitian terdahulu, studi ini menggabungkan analisis sentiment dan topik sehingga mengungkap opini sekaligus konteksnya.
Setelah melalui tahap evaluasi performa menggunakan Confusion Matrix dan memastikan bahwa model SVM memiliki tingkat reliabilitas yang memadai pada data uji, langkah selanjutnya adalah melakukan implementasi model terhadap sisa dataset yang belum terlabeli. Model SVM yang telah dilatih kemudian digunakan untuk melakukan klasifikasi otomatis terhadap 2.294 data komentar lainnya guna memperoleh gambaran menyeluruh mengenai persepsi publik terhadap isu Danantara secara luas. Proses prediksi ini memungkinkan peneliti untuk melakukan generalisasi pola sentimen dari sampel yang ada ke seluruh populasi data yang telah dikumpulkan.
Berdasarkan eksekusi prediksi tersebut, diperoleh distribusi hasil klasifikasi sentimen yang dapat dilihat pada Gambar 3:
Gambar 3. Hasil Klasifikasi
Gambar 4. Rincian Jumlah per Sentimen
Berdasarkan gambar, distribusi data menunjukkan ketimpangan yang signifikan (data imbalance), di mana sentimen Negatif mendominasi dengan 1.330 data (58,0%). Sementara itu, sentimen Netral tercatat sebanyak 671 data (29,3%) dan sentimen Positif merupakan kategori terkecil dengan hanya 293 data (12,8%). Dominasi kelas negatif yang sangat masif ini menjadi faktor utama yang memengaruhi bias pembelajaran model dalam mengenali pola kalimat apresiatif maupun netral.
Fenomena dominasi sentimen negatif ini juga konsisten dengan hasil penelitian terdahulu yang mengkaji opini publik terhadap kebijakan pemerintah di media sosial, di mana kecenderungan pengguna lebih aktif dalam menyampaikan kritik dibandingkan apresiasi. Hal ini memperkuat validitas temuan bahwa distribusi sentimen tidak seimbang bukan semata-mata disebabkan oleh kelemahan model, tetapi juga mencerminkan realitas sosial yang terjadi di ruang digital.
Untuk melihat kata kunci yang mendominasi setiap kategori sentimen tersebut, berikut adalah visualisasi wordcloud dari data yang telah dikumpulkan untuk setiap sentimen :
Gambar 5. WordCloud Sentimen Positif
Gambar 5 menunjukan Visualisasi ini menonjolkan kata kunci seperti "bagus", "moga", "terima kasih", "jelas", "paham", dan "orang baik". Hal ini mengindikasikan bahwa audiens dengan sentimen positif memberikan apresiasi tinggi terhadap kualitas konten dan kejelasan edukasi yang disampaikan mengenai isu Danantara.
Gambar 6. WordCloud Sentimen Netral
Gambar 6 kategori netral, istilah yang muncul didominasi oleh kata-kata teknis dan institusional seperti "danantara", "investasi", "kerja", "dana", "bumn", dan "mitra". Pola ini menunjukkan bahwa kelompok audiens netral cenderung berfokus pada diskusi objektif mengenai mekanisme pengelolaan aset dan perbandingan antarlembaga ekonomi.
Gambar 7. WordCloud Sentimen Negatif
Gambar 7 WordCloud sentimen negatif secara kontras menampilkan kata-kata bermuatan kritik tajam dan kekhawatiran publik,seperti “danantara”, “kalau”, “korupsi”, “negara”, “uang”, “ dan “bumn”. Kemunculan dominan kata-kata ini merefleksikan adanya skeptisisme masyarakat terhadap transparansi serta potensi penyelewengan dalam kebijakan pengelolaan investasi besar tersebut.
Hasil visualisasi ini memperkuat temuan penelitian sebelumnya yang menyatakan bahwa wordcloud mampu memberikan representasi awal yang intuitif terhadap distribusi kata dalam analisis sentimen, meskipun tetap memerlukan metode lanjutan seperti LDA untuk memahami struktur topik secara lebih mendalam.
D. Pemodelan Topik dengan Latent Dirichlet Allocation
Setelah distribusi sentimen diketahui, dilakukan analisis lanjutan untuk mengekstraksi tema utama dari seluruh komentar menggunakan metode Latent Dirichlet Allocation (LDA). Berdasarkan hasil pengujian terhadap kualitas pemodelan menggunakan metrik Coherence Score, penelitian ini menentukan jumlah topik optimal dengan mengidentifikasi nilai keterkaitan semantik tertinggi antar kata dalam dokumen. Menggunakan library Gensim untuk pemrosesan bahasa alami, dilakukan iterasi pengujian mulai dari 2 hingga 6 topik untuk melihat titik puncak pada grafik skor koherensi yang menunjukkan struktur tema paling manusiawi dan logis. Hasil perhitungan nilai koherensi pada tiap jumlah topik untuk kelas sentiment positif dan negatif disajikan pada Tabel 3.
Tabel 3. Nilai Koherence Topik
Perbandingan nilai koherensi dari setiap kategori sentimen tersebut secara lebih jelas dapat dilihat melalui grafik di bawah ini :
Gambar 8. Grafik Skor Koherensi Sentimen Positif
Gambar 8 menunjukkan grafik skor koherensi untuk sentimen positif, di mana nilai optimal berada pada 4 topik dengan skor tertinggi mencapai 0,4341. Setelah mencapai titik puncak tersebut, skor koherensi mengalami penurunan pada 5 topik dan berlanjut hingga 6 topik.
Gambar 9. Grafik Skor Koherensi Sentimen Negatif
Gambar 9 Grafik Skor Koherensi Sentimen Negatif menunjukkan bahwa nilai optimal berada pada 3 topik dengan skor tertinggi mencapai 0,4019. Setelah mencapai titik tersebut, grafik menunjukkan tren penurunan yang signifikan hingga mencapai nilai terendah pada 5 topik, sebelum akhirnya mengalami sedikit kenaikan pada 6 topik.
Gambar 10. Grafik Skor Koherensi Sentimen Netral
Gambar 10 Grafik Skor Koherensi Sentimen Netral menunjukkan tren yang cenderung naik seiring bertambahnya jumlah topik, dengan nilai tertinggi mencapai 0,3671 pada 6 topik. Pola ini mengindikasikan bahwa jumlah topik tersebut merupakan yang paling ideal untuk kategori ini dibandingkan dengan jumlah topik sebelumnya.
Berdasarkan hasil analisis grafik skor koherensi, penentuan jumlah topik optimal dilakukan dengan mengidentifikasi skor tertinggi di setiap kategori sentimen guna menjamin keterkaitan makna yang paling kuat. Sentiment negatif paling konsisten dengan 3 topik (0,4019), positif optimal pada 4 topik (0,4341), dan netral pada 6 topik (0,3671), mencerminkan perbedaan kompleksitas respons publik.
Hasil ini menegaskan efektivitas LDA dalam mengungkap topik laten serta menunjukkan bahwa jumlah topik optimal berbeda tiap subset. Pemisahan berdasarkan sentiment juga memperkaya analisis dibamding pendekatan Tunggal. Setelah menetapkan jumlah topik optimal berdasarkan skor koherensi tertinggi di setiap kategori, tabel berikut menyajikan interpretasi mendalam terhadap kumpulan kata kunci yang merepresentasikan substansi opini publik pada masing-masing sentimen :
Tabel 4. Interpretasi Topik setiap sentimen
Berdasarkan hasil penelitian dan pembahasan, dapat disimpulkan bahwa:
Secara praktis, penelitian ini dapat menjadi bahan evaluasi pemerintah dalam meningkatkan transparansi, komunikasi publik, dan pengelolaan isu, serta referensi bagi media dalam Menyusun konten edukatif yang lebih efektif. Secara teoritis, penelitian ini berkontribusi pada pengembangan text mining melalui integrasi SVM dan LDA untuk mengungkap polaritas serta substansi wacana pada data teks. Penelitian selanjutnya disarankan menggunakan algoritma yang lebih kompleks seperti LTSM atau Transformer, memperluas sumber data, menerapkan Teknik penanganan data imbalance seperti obersampling atau SMOTE, serta melalukan studi longitudinal guna melihat dinamika opini publik.
Penulis menyampaikan terima kasih kepada seluruh pihak yang telah mendukung penelitian ini, khususnya pembimbing, institusi penyedia fasilitas dan data, serta keluarga dan rekan atas dukungan dan motivasinya. Semoga penelitian ini bermanfaat bagi pengembangan ilmu pengetahuan.
[1] F. A. Abdullah, G. N. Bakry, dan S. F. Z. Fibaeti, “Analisis Sentimen dan Jaringan Pada Video Youtube Malaka ‘Memahami Danantara dengan Mudah,’” MUKASI J. Ilmu Komun., vol. 4, no. 3, hal. 750–761, 2025, doi: 10.54259/mukasi.v4i3.5162.
[2] “Danantara Indonesia,” Badan Pengelola Investasi Daya Anagata Nusantara (Danantara Indonesia). Diakses: 25 Februari 2026. [Daring]. Tersedia pada: https://www.danantaraindonesia.co.id/
[3] M. Fazri dan A. Voutama, “ANALISIS SENTIMEN PUBLIK TERHADAP DANANTARA DI MEDIA SOSIAL X MENGGUNAKAN NLP DAN PEMBELAJARAN MESIN,” JOISIE (Journal Inf. Syst. Informatics Eng., vol. 6, no. 1, hal. 197–206, 2025, doi: 10.55382/jurnalpustakaai.v5i2.1180.
[4] D. F. Sarah, U. Khaira, dan M. F. Putri, “Analisis Sentimen Aplikasi Shopeepay Menggunakan Naïve Bayes Dan Pemodelan Topik Latent Dirichlet Allocation,” Djtechno J. Teknol. Inf., vol. 6, no. 2, hal. 402–416, 2025, doi: 10.46576/djtechno.v6i2.6586.
[5] M. R. Nur, Y. Wibisono, dan R. Megasari, “Analisis Sentimen dan Pemodelan Topik pada Post tentang Merek Teknologi di X Menggunakan Fine-tuning IndoBERT dan BERTopic,” J. Komput. Teknol. Inf. Sist. Inf., vol. 4, no. 2, hal. 743–750, 2025, doi: 10.62712/juktisi.v4i2.508.
[6] M. L. Hermanto, O. Ardhillah, Nky, dan A. Ibrahim, “ANALISIS SENTIMEN MASYARAKAT TERHADAP DANANTARA DI PLATFORM X DENGAN METODE SVM,” JATI (Jurnal Mhs. Tek. Inform., vol. 9, no. 4, hal. 6779–6785, 2025.
[7] D. H. Rahman, Z. D. A. Alistin, dan S. Pramana, “Analisis Sentimen Dan Pemodelan Topik Pada Tweet Terkait Data Badan Pusat Statistik Tahun 2024,” Semin. Nas. Off. Stat., hal. 226–236, 2025, doi: 10.47080/simika.v6i2.2789.
[8] R. Z. Firdaus, S. H. Wijoyo, dan W. Purnomo, “Analisis Sentimen Berbasis Aspek Ulasan Pengguna Aplikasi Alfagift Menggunakan Metode Random Forest dan Pemodelan Topik Latent Dirichlet Allocation,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 2, 2025, [Daring]. Tersedia pada: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/14482
[9] A. I. Kamil, O. N. Pratiwi, dan D. Witarsyah, “Analisis Sentimen dan Pemodelan Topik terhadap Aplikasi Pembelajaran Online pada Platform Google Play,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 10, no. 2, hal. 836–849, 2025, doi: 10.29100/jipi.v10i2.6023.
[10] C. L. T. Boro, A. Faisol, dan D. Rudhistiar, “ANALISIS SENTIMEN TERHADAP KAMPANYE PENGURANGAN PLASTIK PADA MEDIA SOSIAL MENGGUNAKAN METODE SVM,” J. Inform. Teknol. dan Sains, vol. 7, no. 1, hal. 147–157, 2025.
[11] R. D. Pebrianti, “ANALISIS SENTIMEN MASYARAKAT PLATFORM X TERHADAP KORUPSI PT. PERTAMINA (PERSERO) MENGGUNAKAN METODE SVM,” JITET (Jurnal Inform. dan Tek. Elektro Ter., vol. 13, no. 2, 2025.
[12] F. A. Ryandi, D. Pratiwi, dan S. Sari, “Analisis Sentimen Masyarakat Terhadap Kasus Judi Online Menggunakan Data Dari Media Sosial X Pendekatan Naive Bayes Dan SVM,” J. Sains dan Teknol., vol. 7, no. 1, hal. 1–6, 2025, doi: 10.47080/simika.v8i1.3624.
[13] F. Fathoni, A. Ibrahim, F. Rizka Mumtaz, M. Azmi Zaky, M. Jodi Pratama, dan I. Akbar Kurniawan, “Analisis Sentimen Public Twitter Terhadap Kebijakan Pemerintah Menggunakan Metode SVM (Studi Kasus : RUU TNI ),” JATI (Jurnal Mhs. Tek. Inform., vol. 9, no. 4, hal. 6322–6329, 2025, doi: 10.36040/jati.v9i4.14036.
[14] A. Farhan, I. Ridat, dan A. R. Isnain, “PEMODELAN TOPIK DENGAN LDA UNTUK MEMAHAMI PERSEPSI PUBLIK TERHADAP APPLE VISION PRO MELALUI ANALISIS BERITA TWITTER,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 10, no. 4, hal. 3233–3246, 2025.
[15] M. Ulfa Yanuar dan W. Wibowo, “Topic Modeling and Sentiment Analysis on Trans Jatim Application User Reviews,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 6, no. 1, hal. 156–166, 2026.
[16] N. N. A. Aryanti dan O. Suria, “ANALISIS SENTIMEN TERHADAP PEMUTUSAN HUBUNGAN KERJA DI INDONESIA : KOMPARASI INDOBERT DENGAN SVM, RANDOM FOREST, DAN DECISION TREE DENGAN OPTIMASI TF - IDF,” RABIT J. Teknol. dan Sist. Inf. Univrab, vol. 10, no. 2, hal. 1158–1176, 2025.
[17] M. H. Tinambunan, A. Hasibuan, S. Wahyuni, dan A. S. Wibowo, “Klasifikasi Tingkat Kepuasan Mahasiswa Terhadap Fasilitas Pada Ftik Universitas Dharmawangsa Medan Dengan Algoritma Naive Bayes,” Bisnis-Net J. Ekon. dan Bisnis, vol. 6, no. 1, hal. 208–215, 2023, doi: 10.46576/bn.v6i1.3356.