AbstractsComputer Science

Method performance difference of sentiment analysis on social media databases; Skillnad i prestanda för sentimentanalysmetoder på data från sociala medier

by Henrik Johansson




Institution: KTH Royal Institute of Technology
Department:
Year: 2016
Keywords: Natural Sciences; Computer and Information Science; Computer Science; Naturvetenskap; Data- och informationsvetenskap; Datavetenskap (datalogi)
Posted: 02/05/2017
Record ID: 2122113
Full text PDF: http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-187259


Abstract

As the amount of available data have exploded with the in- crease in use of social media the interest of doing sentiment anlysis have increased. However as the source and nature of the data have changed it is possible that the known meth- ods will not perform as before. The purpose of this paper is to examine if such a di erence exist and if the methods can be improved through preprocessing the data. The results show that there is a di erence and that on this new type of data a lexicon approach may be a better choice than a machine learning based one. Preprocessing the data give some but no large improvements.  ; Den explosion av tillgänglig data i och med den ökade an- vändningen av sociala medier har ökat intresset för att göra sentimentsanalys. Men eftersom källan och innehållet för den data som analyseras har förändrats är det möjligt att de metoder som används kommer att prestera annorlunda. Syftet med denna studie är att undersöka om en sådan skill- nad finns och om metodernas trä säkerhet kan ökas genom att förarbeta data. Resultatet visar att det finns en skillnad och att en lexikal analys kan vara ett bättre tillvägagångs- sätt än en metod baserad på maskininlärning. Att förarbeta data visar viss men inte i sammanhanget stor förbättring av resultatet.