从步态识别情绪,准确率高达80.07%人工智能

2019-07-03    来源:AI基地    编辑:吉吉吴
依靠步态识别情绪靠谱吗?

       7月2日消息,近日,查珀尔希尔大学(University of Chapel Hill)和马里兰大学(University of Maryland)的研究人员们研发了一种机器学习方法,利用人们步行时的身体语言,解读他们的情绪。

       目前AI情绪识别已有的两种探知模式为视觉情绪识别以及语音情绪识别。视觉情绪识别主要以计算机视觉技术依托,能够精准识别面部表情,想让机器根据面部表情识别人类情绪还稍有欠缺,还需要通过传感器、摄像头等外部硬件进行支撑。另一种方式主要是对面部情绪相关数据集进行标签化分类,通过机器学习算法进行针对性训练,从而实现精准情绪分类。

       情绪不只能被“看”见,还能被“听”见,愤怒时语调高昂,悲伤时语调低沉,语音情绪识别主要从语音、语调、音高等多个维度对用户的情绪加以判定。


       此次研究人员研究出的算法是目前第一个利用最先进的3D人体姿态估计技术,来识别步行视频中目标情绪的方法,它能够从人的步态中识别他们的感知情绪(perceived emotion)、效价(valence)和唤醒(arousal),准确率达80.07%。效价主要表现为人们的消极或积极等情绪,而唤醒则表现为人们情绪的平静或充满活力等状态。
 

       这一研究成果已于美国时间2019年6月14日发表在arXiv平台上,论文名为《利用情感和深层特征识别行走中的情绪(Identifying Emotions from Walking using Affective and Deep Features)》。
 

AI练就新火眼金睛:看步态就能识别情绪,准确率高达80.07%
 

四种情绪丰富步行方式


       研究人员认为,情绪在人们的生活中扮演着重要的角色,既贯穿了人们的经历,同时也塑造了人们看待世界和与他人互动的方式。由于感知情绪在人们的日常生活中有着重要作用,因此自动情绪识别技术在游戏和娱乐、安全和执法、购物、人机交互等领域,已经成为了学术界一个重要的研究内容。在这项技术中,研究人员针对人们的四种情绪进行了研究,分别为快乐、悲伤、愤怒和中性。这四种情绪都能较长时间地影响人们,并能“丰富”人们的步行方式。

 


 

        研究人员从多个步行视频语料库中提取人们的步态,并使用3D姿态估计技术来识别提取的步态和步态表现的情绪特征。这些3D姿态会被传输到能够学习长期相关性的长短期记忆模型(LSTM)网络中,研究人员将利用这一网络从姿态序列中获取特征,并使用多个步态数据集来训练这个LSTM网络。
 

同时,研究人员还将经过计算的情感特征与深层特征连接起来,并与随机森林分类器(Random Forest Classifier)相结合,输出多个独立决策树的平均预测,将提取的步态例子分到上述四种情绪类别中。
 

AI练就新火眼金睛:看步态就能识别情绪,准确率高达80.07%
 

多种步态识别特征


        研究人员获取的步态特征包括了人们的肩膀姿势、连续步伐之间的距离,以及手和脖子之间的区域。在身体语言方面,人们的步行方式常常会受到情绪的影响,例如,当人感到压抑或沮丧时,会比满足时更耸拉着肩膀。机器算法在识别步态的过程中,头部倾斜的角度被用来区分人们快乐和悲伤的情绪,而更紧凑的姿势和“身体扩张”则分别能识别人们的积极和消极情绪。
 

        值得一提的是,在该机器学习方法的识别功能中,效价在心理学上指行为目标对个体是否能实际满足自身需求的价值评估,即个体对行为结果的重视程度,它影响着人们行为动机的强度。另外,唤醒在心理学上,指机体生理性激活的不同状态或不同程度的一种生理和心理活动的准备状态,它主要由感觉兴奋性水平、腺和激素水平,以及肌肉的准备性所决定。科学家们发现,唤醒往往与人们增加的运动相对应。因此,研发人员在利用长短期记忆模型时,还考虑了人们步行速度、加速度,以及手、脚和头部关节“运动抖动”的大小。
 


 

算法准确率高达80.07%


        在人工智能系统处理方面,研究人员提供了一个叫“情绪行走”(Emotion Walk,简称EWalk)的样本。EWalk是一组包含1384个步态的新数据集,这些步态是从24名受试者在大学校园(包括室内和室外)散步的视频中提取的。同时,大约700名来自亚马逊土耳其机器人公司的参与者,还给该数据集的步态情绪进行标记,以便研究人员根据这些标记来确定受试者步态情绪的效价和兴奋程度。
 

       研究报告显示,在测试中,该研究团队情绪检测方法的准确率高达80.07%,比Crenn et al.算法提高了13.85%,比不考虑情绪特征的“vanilla” LSTMs提高了24.6%。
 

AI练就新火眼金睛:看步态就能识别情绪,准确率高达80.07%
 

        但这些数据并不代表该机器学习方法的检测是万无一失的,因为它的准确率在很大程度上取决于3D人体姿态估计和步态提取的精确度。尽管该方法的准确率还存在一定的限制,但研究团队依然相信,他们的机器学习方法能为涉及其他活动,以及其他情绪识别算法的研究提供了可靠的技术基础。在未来,研究人员也将继续收集更多的数据集,进一步解决目前该机器学习方法所受到的限制。
 

        查珀尔希尔大学和马里兰大学的研究人员研发的这种机器学习方法,在情绪识别的准确率上得到了进一步地提高。同时,这也是目前学术界中,率先尝试利用最先进的3D人体姿态估计技术,来识别步行视频中的目标情绪的方法。但是,这一方法的准确率还受到不同研究因素的限制,想要进一步依靠步态识别情绪还有赖于技术的突破与发展,这样才会为情绪识别研究提供更多支持,从而在人机交互、娱乐等方面发挥最大效用。

1
3