人机交互30年
人机交互30年
      自1982年ACM成立人机交互专门兴趣小组SIGCHI(Special Interest Group on Computer-Human Interaction)以来,人机交互(Computer-Human Interaction,CHI)已走过了近30年历程。键盘的出现,将计算机带入了字符用户界面时代。1964年,美国人道格·恩格尔巴特(Doug Engelbart)发明了鼠标(图1),图形用户界面(Graphical User Interface,GUI)随之出现,才有了计算机的主机时代和个人计算机时代,为此,恩格尔巴特也获得了1997年的图灵奖。自图形用户界面出现至今的几十年中,人机交互技术经历了几代人的努力,成就了PC时代的辉煌。  
                                 
                                                                      图1  Doug Engelbart和他发明的鼠标
  70年代Xerox研究中心的Alan Kay提出了Smalltalk面向对象程序设计等思想,并发明了重叠式多窗口系统。
  1989年Tim Berners-Lee在日内瓦的CERN用HTML及HTTP开发了WWW网,随后出现了各种浏览器(网络用户界面),使互联网飞速发展起来。
                                                         
                                                                  图2 Alan Kay和Tim Berners-Lee
   由于笔式交互、触摸、语音、以及基于视频等自然交互设备的出现,新的计算模式被提出,人机交互进入了普适计算(Pervasive Computing)时代。
      90年代美国麻省理工学院N.Negroponte领导的媒体实验室在新一代多通道用户界面方面(包括语音、手势、智能体等),做了大量开创性的工作。
      90年代美国Xerox公司PARC的首席科学家Mark Weiser首先提出“无所不在计算(Ubiquitous  Computing)”思想 。
  人机交互是研究人类所使用的交互式计算系统的设计、实施、评估以及相关主要现象的学科,用户界面(User Interface,UI)是人与计算机之间传递、交换信息的媒介和对话接口,是计算机系统的重要组成部分,用户界面是人机交互技术的物质表现形式。所以在普适计算时代自然交互是其研究的重要主题,人机交互的历史也是从人适应计算机到计算机不断地适应人的发展史。回顾人机交互的发展史,主要经历了以下几个阶段(图3):
  1、早期的手工作业阶段;
  2、作业控制语言及交互命令语言阶段;
  3、图形用户界面(GUI)阶段;
  4、网络用户界面的出现;
1平方米等于多少公顷
  多通道、多媒体的智能人机交互阶段。
                                               
                                                                          图3 界面范式的发展过程
  在早期的命令语言用户界面时代,人和计算机的交互主要是通过键盘来完成的。而此时的计算机主要是大型机,用来进行科学计算,接受文本命令;随着图形界面和鼠标的出现,计算机进入了个人PC时代,接受GUI命令,并帮助我们我们实现了办公自动化。WIMP界面范式是图形界面电脑所采用的界面典范。在人机互动领域之中是最普遍的电脑互动界面,WIMP堪称无人能出其右,举凡微软的Windows、苹果电脑的MacOS,甚至其它以X-
Window为基础的操作系统,均采用WIMP此一界面典范。WIMP是由“视窗”(Window)、“图标”(Icon)、“选单”(Menu)以及“指标”(Pointer)所组成的缩写,其命名方式也指明了它所倚赖的四大互动元件。曾经有人这样评价图形用户界面:“PC plus GUI made the history”。但随着计算机硬件设备的进步和软件技术的发展,WIMP界面的缺点逐渐地体现出来。目前研究者们将研究的焦点聚集到下一代的用户界面的研究上,提出了Post-WIMP(或Non-WIMP)的界面形式。
     用户界面技术的每一次飞跃都需要认知心理学成果的支撑,在人机交互的心理学研究当中,自然、智能用户界面目标是:帮助计算机了解用户,帮助用户更好地使用计算机。WIMP界面概念模型中,认知主体和计算机的交互过程如图5所示,认知主体通过击键或指点向应用程序输入指令,应用程序通过窗口、图标、菜单以及文本向认知主体反馈信息。这种界面模型将认知主体的注意力集中在如何使用计算机上而不是任务的本身。
                     
                                    图4 人机交互的适应发展                                                    图5 传统WIMP界面范式的交互过程
  人机交互大师Turk曾给自然地用户界面下过如下定义:最自然的人机交互技术是指那些能够利用人类自然地认知和感知能力、社会技能以及我们从小就养成的行为习惯。由图6的五种人的感知通道所衍生出的界面形式称为可感知用户界面(Perceptual User Interface, PUI)
                                           
                                                                                    图6 PUI的几种感知通道
  可感知用户界面(PUI)目前主要集中在以下几大领域:触控交互、笔式交互、机器视觉交互、语音交互、脑-机交互、其他传感器类交互以及多通道交互领域。
      触控交互技术已普遍渗入到人的生活当中,触控手机和平板电脑就是这类交互技术的应用实例。美国苹果公司(Apple)将电容屏应用到智能手机当中,推出了iPhone、iTouch以及iPad智能手机和智能平板电脑系列,随后这种触控交互的电子产品风靡全球,几乎将现在所有的智能手机的交互方式都更新了一遍。主题怎么设置 
                                                           
                                                                                        图7 iPhone和iPad
  微软(Microsoft)是多点触控技术的先行者,Microsoft Surface强调使用更为直觉,不需使用任何鼠标及键盘。搭配30寸的大型显示器,其机构外型很像张桌子,可以同时让很多
人在上面触控操作。与一般触控式电脑最大不同在于提供了多点触控(Multi-Touch)功能,可以同时辨识多点的触控资讯,可让多人同时使用一台Surface电脑。严格意义上来讲,像Surface这类交互设备应属于机器视觉交互的范畴,图8右图是Surface的内部构造,它是由位于底部的一个摄像机来获取到人手指的位置和运动信息然后进行分割识别处理而得到交互语义的。但是在交互过程中不存在机器视觉交互的“金手指”问题,所以它更具备触控交互的特点。
                                                   
                                                                                       图8 微软Surface应用和构造
  笔式交互技术应该也属于触控交互,但由于在交互设备上需要用一支电子笔,所以将其单
幽默又夸老师的俏皮话独划为一类。“汉王”的手写设备就是这类交互方式的典型代表。这类设备和上面的触控设备相比不同处除了多了一只电子笔外,其所用的触屏多是电阻屏。笔式交互提倡回归文明、回归自然,特别是对于具有悠远文字文明的我们,笔式交互让我们更贴近汉字文明。
                                                                                 
                                 图9 笔式手写设备
  视觉通道是人与人之间进行交流的一种重要途径,尽管有很多其他方法可以替代视觉进行交流,但人们更原意采用可视的途径交流,因为这样更符合人们的交流习惯-面对面的交流。基于视觉的交互也称为基于视觉的用户界面(Vision Based Interface, VBI),在人机交互上下文环境中,使用计算机视觉技术来感知用户称为基于视觉的交互。VBI是PUI的一
个研究子域,它更多地关注于用户的视觉感知行为。这是一个多学科交叉领域,它结合了计算机视觉、图像处理、模式识别、人机交互、行为心理学等研究成果。视觉用户界面试图回答以下问题【Turk 1998】
  1、存在和位置:有人在那里么?有多少人他们在哪里?[人脸检测、身体检测、头部和身体跟踪]
胆固醇高十大饮食禁忌  2、身份:他们是谁?[人脸识别、步态识别]
2021年1月7日是几九  3、表情:用户正在微笑、皱眉、大笑还是说话?[面部表情识别、表情建模和分析]鼠标加速
  4、注意焦点:用户正在看什么?[头部/面部跟踪,目光跟踪]
  5、身体姿势和运动:用户的整体姿势和运动是什么?[身体建模和跟踪]
  6、手势:用户的头部、手、身体的运动表达了什么样的语义信息?[手势识别、头部跟踪]
  7、行为:用户正在做什么事情?[人体运动分析]
      利用视觉手势可以方便、有效地完成以下任务:
      1、代替鼠标完成指点和勾画任务;
  2、虚拟环境中漫游以及操纵虚拟对象;
  3、控制家电设备(例如电视、CD播放机等)和指挥机器人;
  4、通过手语进行交流。 
  目前,基于视觉的交互是人机交互领域的一个研究热点。如智能相机、Anote 数码笔以及微软的XBOX体感游戏机都是这一领域的研究成果。严格地讲,Anote数码笔虽然采用了视觉处理技术,但应该属于实物操作界面(Tangible User Interface, TUI)的范畴。实物操作界面倡导的是周围环境中的物体都是交互的接口(World will be interface.)。Anote数码笔是由数码纸和数码笔组成的,所谓的数码纸就是普通的纸,数码笔就是一支普通的圆珠笔。它通过微型摄相头读入笔尖高速书写的笔迹和Anote 数码纸的微点坐标,微处理器分析处理后通过蓝牙无线或USB等方法转送到电脑或携带手机之中。们只需用「Anote 数码笔」在「Anote 数码纸」上与平常一样书写与记录、就可以将信息简便的输入电脑。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。