【UXRen译#52】社会情感和情感分析

SENTIMENT-ANALYSIS-00

当问及“什么是情感分析?”的时候,默认的回答通常是“监测和了解观众对一个品牌的反应,不管是积极反应还是消极反应”。

事实上,这仅仅描述了情感分析所包含及可能做到的一小部分内容。如今一些市场营销人员倾向于将分析交由专门的分析工具来处理,但情感分析背后的科学也是非常迷人的——分析的多层次性,以及那些使得情感分析更为精准的错综复杂的细节处理,只有在人而非机器来进行的时候才能得以显现。

如今,情感分析是社群聆听不可或缺的一部分,虽然它也可以自成一体。通常的方法是参照以下指南:

如果一块内容的积极关键词多于消极关键词,那它就属于积极内容;如果消极关键词多于积极关键词,那它就属于消极内容。

虽然这并非完全错误,还可以包括更多的内容。本文将会从一个较为浅显的层次上阐述一下这个分析究竟是如何操作的,以及自动化情感分析的含义和情感分析的未来发展。

 

什么是情感分析?

情感分析并不仅仅是社会分析工具的特性——它是一个研究领域。这是一个仍在研究的领域,由于分析的错综复杂还不是很详尽。以同样的方式,语言学的一些方面依然处于争论状态或者还不完全理解。

当你在一些文章内容上使用情感分析时,你通常会找到内容上的观点并分析了这些观点中的情感。

一种观点是一种表达式(精确而言是一个二项式),包括以下两个部分:

  • 目标(大多数的分析工具称其“主题”);
  • 对目标/主题的情感。

因此,例如“我爱公司”,“公司”就是主题,情感(通过动词“爱”表达)是积极的。

 

语义学与情感

尽管一些工具依赖根据情感词汇的“倾向”来评分 (例如词汇在积极和消极的坐标轴上的位置),但是精确的情感分析并非仅仅只看关键词或独立的单词,还要看语义学。

语义学是一门关于词汇、短语、符号及其意义(符号代表的意义)之间的关系的研究。由于语义学,我们不能假定一个句子包含正面的情感词汇(例如有用的)就是积极的,或者一个句子里包含消极的情感词汇(例如没用的)就是消极的。事实上,其他的词汇可能会转化一个词的情感意义,例如:

  • 比较级(例:我发现这个工具没有你的有用。)
  • 连词(例:这个工具随处可见但是很有用。)
  • 情态动词(例:理论上来说,这个工具应该有用。)

除了单独的词,表达式和短语可用于表达情感。例如“我在月球”。 如果逐字逐句,“在”和“月球”都不是情感词,因此它们并不表达积极或消极的意义。因此,我们可以总得出结论,情感通过逐字逐词的分析不能够精确地推测,而是在一定水准上进行语义解释。

 

关于社群聆听的自动情感分析

当寻找一个社群聆听工具(比如Brandwatch, Synthesio, Salesforce Radian 6, Crimson Hexagon, Attensity)的时候,就目前来说寻求自动情感分析的规范是属于一种附加特性的,此特性的缺失或低精度的特性必定是行不通的。然而,不管你选择依赖某种工具来寻找情感,还是鼓足勇气动手去做(依据内容量),了解情感分析幕后的情境和构建模块都是很重要的。

例如:假设一个名叫Joe Smith的人,2013年12月16日在SimplyMeasured’s Facebook wall写了如下的评论:

我刚试着注册了SimplyMeasured,到目前为止我还是很喜欢它的。这些报道非常不可思议,它们的博客也非常具有教育意义。然而,我同事认为有些昂贵。
——日期:2013年12月16日

我们可以将这个评论拆分成以下几个小短句:

  1. 我刚试着注册了SimplyMeasured。
  2. 到目前为止我还是很喜欢它的。
  3. 这些报道非常不可思议。
  4. 他们的博客也非常具有教育意义。
  5. 然而,我同事认为是昂贵的。

这些评论一般是积极的,可以拆分成几个分句。这些评论通常是关于围绕SimplyMeasured的一些观点,有积极的也有消极的。

  1. 句1是中立的,没有表达任何的情感;
  2. 句2总的来说表达的是关于工具的积极观点;
  3. 句3表达的是关于工具报道的积极观点;
  4. 句4表达的是关于公司博客的积极观点;
  5. 句5表达的是关于工具价格的消极观点,是从作者同事的观点。

从而我们可以推断出:

  • 目录所说的观点来自于多个人,在这我们称之为“观点持有者”。句2、3、4的观点持有者是John Smith,而句5的观点持有者是John Smith的同事
  • 和句1不同的是,我们不能让句2、3、4、5脱离语境,因为单独阅读时也不能了解其含义。以句3为例,我们可以发现围绕SimplyMeasured方面的观点是“报道”。深度评论也会发现这一主题的不同属性:报道的可信度、设计、布局、性能等。因此,主题可以拆分为不同的方面。如下图所示:
    social sentiment analysis
  • 较长的评论也会有一长串的观点,一般在论坛和评论网站上可以找到,不管是在Tripadvisor上的一篇酒店评论,还是一系列的游戏评论。当我们开始关注评论的核心主题与其不同的方面(包括其要点和属性)之间的嵌套关系的时候。如图所示:
    social sentiment analysis
  • 最后,观点会随着时间改变,取决于很多因素,有主观的(例:用户理解)也有客观的(例:价格变动)。因此,在情感分析中不但要考虑情感,而且还要考虑时间。

目前,当我们做社群聆听进行情感分析时,有五个主要的因素要考虑:

  • 主题:讨论的主要领域是什么?
  • 方面(要点和属性):这些主题主要讨论的是什么?
  • 情感:内容和观点中所包含的情感是什么?
  • 持有者:讨论的是谁的观点?有多个相同的内容吗?如果有,有什么不同?是否一样?
  • 时间:什么时候发布内容?

 

层次分析法

让我们回顾一下Joe Smith在SimplyMeasured’s Facebook wall所发表的评论:

我刚试着注册了SimplyMeasured,到目前为止我还是很喜欢它的。这些报道非常不可思议,它们的博客也非常具有教育意义。然而,我同事认为有些昂贵。
——日期:2013年12月16日

当你可以通过一些方式进行情感分析的时候,最后你将会找到以下三种方法:

  1. 文档层级:分析文档中所表达的整体情感,最好假设整个评论只讨论一个主题。总的来说,评论都是积极的。
  2. 句子层级:审查句子中所表达的情感。五个句子中,第一个没有表达任何情感,仅陈述了一个事实(“我刚注册了SimplyMeasured”)。剩下的句子所表达的情感:第二个、第三个和第四个是积极的,只有第五个是消极的。
  3. 实体与方面层级:这种细粒度的分析将内容里所表达的观点都考虑进去了,关于报道、博客和试验中的观点皆是积极的,而关于价格的观点是消极的。

 

比情感更深

我们有两个与情感密切相关,也可以塑造社会情感的因素:主观性和情绪。

主观性

一个客观的句子描述的是事实信息,而一个主观的句子表达的是个人的感受、观点和信念。

虽然相似,但是主观的句子和表达意见的句子(例如,带有情感的句子)是不同的:

  • 一个主观的句子可能不会表达任何的情感。“我想我用的是最新版本的浏览器。”这是个主观的句子,虽然没有表达任何情感。
  • 一个客观的句子可能暗含着情感。“当更新完之后我打开了浏览器,它又崩溃了。”虽然句子陈述的是一个事实,也表达了关于主题的一个暗含的观点(浏览器崩溃了)。
情绪

虽然有时可以互换,但是情绪和情感是不一样的,尤其是情感分析。情感受情绪的影响,是主观的感受和想法。情感的力量通常和观点持有者的情绪强度联系起来。

情绪有助于区分理性评价与情绪评价之间的区别:

  • 理性评价:从理性的推理和实际的信仰进行评价(例:关于这个工具的报道非常有用。)
  • 情绪评价:从无形和情绪化的冲动进行评价(例:这些报道是目前最好的。)

当做完这些区别之后,我们可以建立一个情感得分系统,将以下的情感评级考虑进去:

  1. (+2)情绪化的积极
  2. (+1)理性的积极
  3. (0)中立的
  4. (-1)理性的消极
  5. (-2)情绪化的消极

 

情感

这所说的情感有几个?主要有两个,总的来说是四个。

主要的两个是指积极的和消极的,是对立的两极。然而,重要的是了解情感并不是非黑即白的主题。这就是中立的情感同等重要的原因。有些句子并不是表达情感:这不是消极性的暗示也不是积极性——这只是没有情感。

同时,尤其是在文档层级和句子层级来看内容时,我们可能会发现相互矛盾的观点或者不同情绪的多种观点。例如,“我喜爱冰冻酸奶,虽然我不喜欢普通酸奶。”并不是完全的积极或完全的消极,这样情感的表达,我们不能概括为中立。然而,当把观点拆分来看,我们可以看到在第一个分句里有积极的情感(“我喜爱冰冻酸奶……”),消极的情感在第二个分句中(“……虽然我不喜欢普通酸奶。”)。当我们在一页文档里拥有相同数量的积极观点和消极观点时,我们就会有矛盾的情感。

一些工业化的工具包括两个变种的情感:积极的中立(介于积极和中立之间)和消极的中立(介于消极和中立)。当显示不同等级的情感时这两者是有帮助的,主要依据的是强度。例如,“我有点喜欢这个新产品”和“我绝对喜欢这个新产品!!!”二者皆是积极的,虽然是不同的强度。

不幸的是,当谈及自动情感分析的时候,我们选择识别情感的数量越高,情绪分配的错误几率也就越高,因此就会降低准确度。

 

情感问题

我曾在大学里修语言学时所学到的一件事情就是语言是复杂的。实际上,通过过度简化语言认为潜在的情感是可以通过机器或算法精确地测量出来的想法太过天真。

以下有四个主要的因素目前可以阻止我们盲目地依赖工具做情感分析:

  1. 语境
    一个积极的或消极的情感词汇可以根据语境来决定其对应的含义。(例:我的网络提供商窃取我的钱财时真是干得太棒了。)
  2. 情感模糊:
    一个句子中含有积极词汇或消极词汇不一定表达任何情感。(例:“你可以推荐一个我能够使用的好用的工具吗?”虽然句子中使用了积极词汇“好用的”,但是没表达任何情感)同样地,句子中没有情感词汇也可以表达情感。(例:“这个浏览器花费了大量的钱。”虽然在文档层级上是明显地消极,但是句子中没有包含任何情感词汇。)
  3. 讽刺:
    如果句子是讽刺意味,那么积极情感词汇和消极情感词汇可以转换。(例:好吧,我非常开心的是我的浏览器在我做课程作业中刚好崩溃了。)
  4. 语言风格:
    词汇可以根据语言风格的运用改变情感和意义。通常见于俚语、方言和语言变化中。例如“sick”这个词,虽然目标对象明确,但是可以根据语境、语气和语言风格变化其意义。

 

情感分析的现状

这篇文章看似包含了很多内容,其实这只是情感分析相关领域的一小部分,笔者没有讨论观点之间的比较、超出文本内容的情感分析(怎么测定一段Vine视频或一张Instagra图片的情绪?)、社会互动的情感分析(你可以把赞和评论归类为两种积极的互动吗?能把取消关注归类为消极互动吗?)以及在情感中标点符号的作用(在“我很好!!!”和“我很好。”之间也被认为有很大的不同)…

只有这么多关于这个主题的信息所以也许我该写一篇关于此的论文。(不,我是认真的。)

这带给我们两个最后的问题:工具可以精确地分析情感吗?以及情感分析的未来将如何发展?

 

工具可以精确地分析情感吗?

工具不能够阐明像讽刺(当隐藏的反面情绪不能获得的时候,那工具从何处获得表面上的情绪)和社会情绪这些因素,一些表达可以通过相同的语言说明取决于在哪说(例如英式英语和美式英语相比较)。

话虽如此,虽然人类的情感感知比工具的感知更加成熟和精确,但也不是100%精确。

如以下论坛评论:

我离开公司A去了公司B是因为他们最新的独有的服务,这是我不能错过的!如果公司A的客户服务能够更好,我肯定愿意回去。

如果工具作为中立的简短陈述返回,基于积极观点和消极观点的数量,但我们基于人类的感知,我们可能赞同也可能不赞同依据感知的工具判断。公司A和公司B对这则评论的感知是不同的,这取决于他们所关注的哪些方面。如果公司B关注的是他们最新服务的反馈,此陈述一定是积极的,虽然会有对客户服务的消极陈述。因此,如果我们带有的是普通的情感,那么情感也可以依据谁做的分析来改变。

最后,工具的精确度只是人类判断和工具判断相一致的次数的百分比。人与人之间意见相符的程度也被称为人类和谐。不同的人和公司(包括被Attensity合并以前的Biz360)对此进行了不同的研究,他们得出的结论是人类和谐的比率处于70%和79%之间。

将这些考虑进去,我们可以安全地说情感分析工具的良好精确度是70%。问题在于,工具的精确度少于70%的时间是不精确的,而100%精确的完美工具得出的数据大约30%我们是不赞成的。

 

情感分析的未来将如何发展?

鉴于其巨大的未开发的领域,还有很多关于情感分析的问题还没得到解答。

例如,社会情感分析是否可以帮助我们预测事件?在Barack Obama与Mitt Romney竞选的时候我们就见过几次。也有一些最近发生在英国的案例,Tweview尝试使用情感、量级和一些其他的社会因素(使用来自Brandwatch的API)来预测2013年的X因素的获胜者。尽管他们预测Nicholas McDonald是2013年X元素的获胜者,最终他获得了第二,Sam Bailey赢得了胜利。(你可以从这里阅读更多关于Tweview的实验)

我们也许可以将社会情感运用于其他的社会预测情境中,比如一场病毒的战役,或者一场公关灾难,或者一场商业调整又或者一个应用更新?也许吧。

最后,我们是否能够拥有了一款100%精确的情感分析工具?

答案是否定的,其实这也是件好事。原因是:一个可以达到100%精确地工具可能是有瑕疵的,由于与人类和谐的冲突会使得我们有30%的意见与之相悖。

市场营销人员需要的能进行自动情感分析的理想的工具需要具有以下4种基本的特点:

  • 内容类型过滤:
    并非所有的线上内容是相同的—论坛的情感和其他的社交平台是不同的,例如微博客网站(例:Twitter, Tumblr)的情感和其他的线上资源就是不同的。鉴于这些,一个理想的工具需要能够通过平台过滤搜索结果,因此你就可以通过内容类型过滤这些结果。最后是情感。
  • 分析层级:
    当大多数的工业工具在一个文章层级上衡量情感的时候,一个理想的工具可以支持我们所讨论的情感分析的三个层级:文章层级、句子层级和主题层级。
  • 人类准确性:
    替代一个工具试图达到100%精确,需要和我们的人类和谐保持一致,有理解力的因素可以冲击人类语言、语境和不同类型的语言学方面(例:语义学)。理想的工具在这个领域有强大的能力,以及基于人类的反馈不断地优化。(例:通过修正、人工覆盖到定期更新)
  • 情感覆盖:
    为了解决剩下的30%与人类和谐的冲突,理想的工具需要允许用户能够覆盖自动情感、改变主题以及移除不相干的结果。

最后,不管你所选择的工具是哪个(如果有的话),社会情感具有很大的潜力。如果轻易地将其当作“软度量”,那么当用于一定的语境的时候是非常有用的——是的,你已经收到了一个积极的评论,但是着对你的品牌来说意味着什么?特定内容的背后暗含的观点是什么?若使用得当,情感可能是不同类型的社会分析、预测的关键,甚至最终是对你的社会表现的严肃洞察。

 

 

版权所有:UXRen翻译组 (转载请注明出处!)
译者:方糖小姐
审校:Omei

 

原文作者:BRNRD.ME
发布日期:DECEMBER 16, 2013
原文链接:http://brnrd.me/social-sentiment-sentiment-analysis/
顶部图片来源:http://oursocialtimes.com
 
 
 

发表评论

您的电子邮箱地址不会被公开。