Lexicon based merupakan suatu proses menggunakan berbagai kata yang dianggap sebagai skor dari polaritas untuk dapat mengetahui tanggapan dari costumer mengenai topik tertentu.
Keunggulan dari proses ini yaitu tidak membutuhkan data-data pelatihan, namun tetap saja kelemahanya masih banyak kata yang tidak termuat ke dalam leksikon tersebut.
Mixed antara machine learning dan lexicon based. Dimana dalam prses ini menggabungkan kedua proses lainnya tersebut untuk memaksimalkan hasil atau data yang ingin dicapai. Namun proses ini sangat jarang digunakan oleh perusahaan karena memang caranya yang lebih rumit.
Baca Juga: Bagaimana Cara Meningkatkan Produktivitas Kerja?
2. Evaluasi
Proses online media monitoring ini dilakukan ketika data sudah terklasifikasi sehingga dilanjutkan penggunakan matrik evaluasi yaitu Recall, Precision, Accuracy, dan F Score.
Dalam proses ini akan melibatkan pengukuran secara rata-rata seperti halnya mikro makro dan F1, daripada menangani data masuk pada dua klasifikasi ataupun lebih.
Matrik yang digunakan tersebut berdasarkan keseimbangan dari klasifikasi data per set. Sederhananya, skema yang digunakan yaitu pre-processing, tinjauan set data, penghapusan stop words, tokenizer, klasifikasi, evaluasi, dan transformasi.
Baca Juga: 8 Jenis Training untuk Karyawan yang Dapat Meningkatkan Produktivitas
3. Visualisasi Data
Dalam proses ini, dilakukan dengan menggunakan suatu bagan yang disesuaikan dengan kebutuhan-kebutuhan perusahaan atau manajemen yang membutuhkan data tersebut. Kebanyakan orang menggunakan teknik-teknik familiar seperti penggunaan histogram, grafik, dan matriks.
Sebenarnya hasil akhir dari penggunaan sentiment analysis memang dapat dikatakan sangat variatif.