Mengenal Sentiment Analysis

Pada postingan sebelumnya saya menjelaskan Cara Sentiment Analysis Twitter dengan R ,kali ini kita akan mengenal lebih dekat dengan materi ini.


Apa itu Sentiment Analysis ?

Sentiment Analysis adalah penambangan kontekstual teks yang mengidentifikasi dan mengekstrak informasi subjektif dalam sumber, dan membantu para pembisnis untuk memahami sentimen sosial dari merek, produk atau layanan mereka saat memantau percakapan online. Namun, analisis aliran media sosial biasanya terbatas pada analisis sentimen dasar dan menghitung berdasarkan metrik. Ini sama saja dengan menggaruk permukaan dan kehilangan suatu informasi penting yang menunggu untuk ditemukan. Jadi apa yang harus dilakukan mereka untuk menangkap buah yang telah matang tersebut ?

Dengan kemajuan terbaru dalam pembelajaran mendalam, kemampuan algoritma untuk menganalisis teks telah meningkat pesat. Penggunaan kreatif teknik kecerdasan buatan canggih dapat menjadi alat yang efektif untuk melakukan penelitian mendalam. Kami percaya bahwa penting untuk mengklasifikasikan percakapan pelanggan yang masuk tentang merek berdasarkan pada baris berikut:

1. Aspek kunci dari produk dan layanan merek yang diperhatikan pelanggan.
2. Niat dan reaksi yang mendasari pengguna terkait aspek-aspek tersebut.
Konsep dasar ini ketika digunakan dalam kombinasi, menjadi alat yang sangat penting untuk menganalisis jutaan percakapan merek dengan tingkat akurasi manusia.

Apa saja metode pendekatan Sentiment Analysis?

Secara umum, terdapat 2 pendekatan untuk melakukan Sentiment Analysis, yaitu pendekatan menggunakan Machine Learning dan dan pendenkatan menggunakan Knowledge-Based. Pendekatan-pendekatan tersebut memiliki kelebihan dan kekurangannya masing-masing.

1. Machine Learning Approach

Machine Learning memerlukan dataset untuk digunakan sebagai data training. Data training adalah proses pembelajaran yang dilakukan oleh mesin menggunakan data / dataset yang tersedia. Akurasi dari pendekatan klasifikasi machine learning sangat baik, akan tetapi performa klasifikasinya tergantung dataset yang digunakan. Metode-metode yang masuk ke dalam kategori ini adalah sebagai berikut:

  • Naïve Bayes
  • Maximum Entropy
  • SVM
  • Neural Network


2. Knowledge-Based Method Approach

Knowledge-Based adalah pendekatan Sentiment Analysis pada word level, dimana entitas yang diproses adalah kata. Metode-metode yang masuk di dalam pendekatan ini adalah sebagai berikut:


  • Lexicon-Based
  • PMI (Pointwise Mutual Information)


3. Hybrid Approach

Pendekatan ini menggabungkan knowledge-based approach dan machine learning approach. Beberapa penelitian sukses mengaplikasikan keduanya secara bersamaan.


Contoh Penggunaan Sentiment Analysis ?


Sentiment analysis dilakukan pada data review film yang didapat dari IMDb. Pelabelan data dilakukan secara otomatis menggunakan star rating yang diberikan oleh penulis review. Kemudian star rating tersebut dibagi menjadi 3 kategori, yaitu positive, negative dan netral. Hanya data yang berlabel positive dan negative yang digunakan sebagai data training. Untuk menghindari bias dari penulis review, jumlah review dari seorang reviewer dibatasi hanya 20 review per kategori label. Hasil penelitian menunjukan bahwa SVM memiliki persentase akurasi tertinggi dari ketiga metode yang digunakan. Selain itu, penggunaan unigram dengan negation-tag pada proses training memiliki persentase akurasi lebih baik dibandingkan jika menggunakan bigram. Penggunaan word presence dan word count juga mempengaruhi akurasi sentiment analysis. Penggunaan word presence memberikan akurasi lebih baik dibandingkan menggunakan word count pada proses training. Selain itu dicoba juga proses part-of-speech atau POS tagging pada preprocessing. Tujuannya adalah untuk menghindari penggunaan kata yang tidak tepat, seperti misalnya “I love this movie” yang memiliki sentiment positif dengan “This is a love story” yang bersentimen netral. Akan tetapi hasil percobaan tidak lebih baik dibandingkan dengan tanpa menggunakan POS tagging.


Sumber :

Previous
Next Post »