人机交互的理解

最早系统接触“人机交互”这个概念是在上大学的时候,有一门专业课《教学媒体与技术》,目前所学知识所剩无几,只记得当时上这门专业课的时候,挺感兴趣的。人机交互——人和机器打交道的方式。

人机交互的形式大概发生了一下3个方面的升级:

1.以鼠标和键盘为媒介的人机交互;

2.以触摸屏幕,手写笔等为媒介的人机交互;

3.以语音为载体的人机交互;未来可能有更多的人际交互的形式。

在这个发展的过程中,变化最大的其实是交互从图像到语音的转变。声音承载了人类的思想和情感,图像承载了人类的表象和直觉。可见图形交互更容易获取到用户注意力,人类的第一印象由外表决定的。图像媒介虽然承载的信息量更大, 但是,图形界面的交互需要手指的触碰触发,超过一个手臂的自由操作范围的远场的交互,图像界面可能就会有壁垒。在此,语音交互在一定范围内更有优势。这也是语音交互的最大魅力之一:解放双手!相对于图像交互,语音交互也有其优势所在,但是语音交互依然存在一下问题。

语音交互,目前存在的主要问题是:

1.语音交互唤醒不自然目前的语音交互唤醒是以发出语音指令来唤醒机器,这种唤醒方式不够自然。生活生的场景下,人人交互会通过声音,手势,肢体动作,距离,唇动来镜像交互。要解决这个问题可以给语音唤起添加更多的唤起方式,多种方式共存来唤起语音交互。通过几个维度来判断被唤起的交互方式,第一个维度可以是距离判断是近场还是远场;第二个维度是手势,肢体动作;第三个维度是唇动,声音。

2.机器人没有情感,交互方式过于呆板机器人的EQ包含两个部分,一部分情绪的识别,一部分情绪的应对。对于情绪识别,通过人脸锁定,图像分析等方法,了解用户的情绪,主动触发;通过自然语言分析的方法,情感词的标记和分析识别用户的情感。对于情绪应对,通过分析用户的输入和多轮对话分析,对用户情绪进行反映。结合前面的情绪识别,可以在对语音语义的理解基础之上,识别在此处语音语义发生的时候,用户的情感是如何的状况。

3.机器人的交互行为不够主动,大多是被动式交互,对话过程不平等;85%的用户对主动交流有期盼,目前机器人的人机交互,多数是通过被动触发的, 不够主动,让使用者感受不到被关注的感觉。同时,在这个过程中也是不平等对话的机制,只有当机器被触发之后才会与用户产生互动,而不会主动产生识别人的情绪,所谓“察言观色”。这样的不平等的交互也是目前存在的主要问题。

目前人机交互主要应用于:聊天,问答,对话这三种场景中。

聊天:机器人被动唤起问答:通过一问一答的形式来表现,目前还缺乏深度结合上下文的问答系统。多数是专家系统来呈现某领域的专业知识。

演示站: github.crmeb.net/u/LXT

猜你喜欢

转载自juejin.im/post/5d38fe065188251b4b32bb90