Text
Implementasi Web Scrapping Schema Based Untuk Analisis Sentimen Berita Online Menggunakan Metode Support Vector Machine
Perkembangan portal berita online menghasilkan informasi yang melimpah setiap hari,
sehingga diperlukan metode otomatis untuk mengolah dan menganalisis data tersebut.
Penelitian ini bertujuan mengimplementasikan web scraping berbasis skema untuk
pengambilan data berita online yang dianalisis sentimennya menggunakan metode
Support Vector Machine (SVM). Pendekatan schema-based diterapkan untuk mengatasi
perbedaan struktur HTML antar portal berita agar menghasilkan data yang terstruktur
dan konsisten. Data berita dikumpulkan dari portal yang telah dianalisis dan
didefinisikan pada sistem menggunakan teknik asynchronous crawling, kemudian
diproses melalui tahapan preprocessing meliputi case folding, cleaning, tokenizing,
filtering, dan stemming. Ekstraksi fitur menggunakan metode Term Frequency-Inverse
Document Frequency (TF-IDF) untuk pembobotan kata dalam dokumen. Dataset
penelitian berjumlah 1000 data dengan pembagian 80% data latih dan 20% data uji,
diklasifikasikan ke dalam tiga kelas sentimen: positif, netral, dan negatif. Hasil evaluasi
menggunakan confusion matrix menunjukkan metode SVM mampu mengklasifikasikan
sentimen dengan akurasi 92,16 %. Temuan ini membuktikan bahwa kombinasi web
scraping berbasis skema dan metode SVM efektif untuk analisis sentimen berita online
berbahasa Indonesia.
Kata Kunci: Analisis Sentimen, Schema-Based, Support Vector Machine, TF-IDF, Web Scraping
Tidak tersedia versi lain