HCI学习，基于Human-computer interaction: an empirical research perspective 一

1.简要的介绍

尽管人机交互出现在20世纪80年代，但它在很大程度上归功于旧学科。其中最核心的是人为因素或人体工程学领域。它涉及人类的能力、局限性和性能，以及高效、安全、舒适甚至让使用它们的人感到愉快的系统设计。从尊重和促进从业者在设计系统时运用技能的创造性方式的意义上讲，这也是一门艺术。人机交互的范围非常广泛。它利用了心理学（特别是认知心理学和实验心理学）、社会学、人类学、认知科学、计算机科学和语言学等学科的兴趣和专业知识。

2.里程碑的发明：鼠标

同时期还有光笔（light pen），knee-controlled lever和Grafacon等
这些都是为远离显示器操作设备发明的。
远离显示器操作设备意味着需要某种形式的屏幕跟踪器（光标）来建立设备空间和显示空间之间的对应关系。虽然这在今天看来是显而易见的，但它是20世纪60年代一种新兴的人机交互形式。
下面部分的内容通过对比试验，证明了鼠标是人机交互研究领域的一个里程碑

In the comparative evaluation, English et al. (1967) measured users’ access time (the time to move the hand from the keyboard to the device) and motion time (the time from the onset of cursor movement to the final selection). The evaluation included 13 participants (eight experienced in working with the devices and three inexperienced). For each trial, a character target (with surrounding distracter targets) appeared on the display. The trial began with the participant pressing and releasing the spacebar on the system’s keyboard, whereupon a cursor appeared on the display. The participant moved his or her hand to the input device and then manipulated the device to move the cursor to the target. With the cursor over the target, a selection was made using the method associated with the device. Examples of the test results from the inexperienced participants are shown in Figure 1.6. Each bar represents the mean for ten sequences. Every sequence consists of eight target-patterns. Results are shown for the mean task completion time (Figure 1.6a) and error rate (Figure 1.6b), where the error rate is the ratio of missed target selections to all selections. While it might appear that the knee-controlled lever is the best device in terms of time, each bar in Figure 1.6a includes both the access time and the motion time. The access time for the knee-controlled lever is, of course, zero. The authors noted that considering motion time only, the knee-controlled lever “no longer shows up so favorably” (p. 12). At 2.43 seconds per trial, the light pen had a slight advantage over the mouse at 2.62 seconds per trial; however, this must be viewed with consideration for the inevitable discomfort in continued use of a light pen, which is operated in the air at the surface of the display. Besides, the mouse was the clear winner in terms of accuracy. The mouse error rate was less than half that of any other device condition in the evaluation (see Figure 1.6b). The mouse evaluation by English et al. (1967) marks an important milestone in empirical research in HCI. The methodology was empirical and the write-up included most of what is expected today in a user study destined for presentation at a conference and publication in a conference proceedings. For example, the writeup contained a detailed description of the participants, the apparatus, and the procedure. The study could be reproduced if other researchers wished to verify or refute the findings. Of course, reproducing the evaluation today would be difficult, as the devices are no longer available. The evaluation included an independent variable, input method, with six levels: mouse, light pen, joystick (position-control), joystick (rate-control), and knee-controlled lever. There were two dependent variables, task completion time and error rate. The order of administering the device conditions was different for each participant, a practice known today as counterbalancing. While testing for statistically significant differences using an analysis of variance (ANOVA) was not done, it is important to remember that the authors did not have at their disposal the many tools taken for granted today, such as spreadsheets and statistics applications.

而鼠标的发明人道格拉斯·恩格尔巴特（Douglas Engelbart）也获得了图灵奖

3.star workstation与隐喻

Star旨在作为一个办公自动化系统（Johnson等人，1989）。商业专业人士的办公桌上会有Star工作站，并使用它们来创建、修改和管理文档、图形表、演示文稿等。工作站通过高速以太网电缆连接，共享集中资源，如打印机和文件服务器。Star哲学的一个关键原则是，员工希望完成工作，而不是摆弄电脑。显然，计算机必须易于使用，或者可以说是隐形的。star的一个新颖之处是使用了桌面隐喻(desktop metaphor）。隐喻（metaphor)在人机交互中很重要。当隐喻出现时，用户就可以开始知道该做什么。用户利用来自另一个领域的现有知识。桌面隐喻将概念从办公桌面带到了系统的显示中。在显示器上，用户可以找到文档、文件夹、托盘和计算器、打印机或记事本等附件的图形表示（图标）。图1.8展示了Star图标的几个示例。通过使用现有的桌面知识，用户可以立即了解该做什么以及事情是如何运作的。Star的设计师和其他人将隐喻的极限推向了现在更像办公室隐喻而不是桌面隐喻的地步。显示器上有窗口、打印机和垃圾桶，但当然这些工件在办公室桌面上找不到。然而，这个隐喻似乎奏效了，因为我们甚至在今天听到GUI是桌面隐喻的一个例子。我将在第三章中再次讨论隐喻。为了使系统可用（不可见），Star开发人员创建了处理文件而非程序的交互。因此，用户“打开文档”，而不是“调用编辑器”。这意味着文件与应用程序相关联，但这些细节对用户隐藏。打开电子表格文档会启动电子表格应用程序，而打开文本文档会打开文本编辑器。
在这里插入图片描述

通过GUI和点选择交互，Star界面是直接操作的原型。图形交互和指向设备的赋能工作已经完成。相比之下，以前的命令行界面只有一个输入通道。对于每一个操作，都需要一个命令来调用它。用户必须学习和记住系统命令的语法，并键入它们来完成任务。直接操作系统，如Star，有许多输入通道，每个通道都与一个任务直接对应。此外，与通道的交互是根据任务的属性量身定制的。连续属性，如显示亮度或音量，具有连续控制，如滑块。离散属性，如字体大小或字体系列，具有离散控件，如多位置开关或菜单项。每个控件在显示器上也有一个专用位置，并使用直接点选择操作进行操作。Johnson等人（1989，14）将直接操纵比作驾驶汽车。油门踏板控制速度，杠杆控制雨刮器，旋钮控制收音机音量。每个控件都是一个专用通道，每个控件都有一个专用位置，并且每个控件都根据其控制的属性进行操作。
驾驶汽车时，驾驶员可以调节收音机音量，然后打开挡风玻璃雨刷。或者，驾驶员可以先打开挡风玻璃雨刷，然后调整收音机音量。汽车能够根据驾驶员的意愿以任何顺序响应驾驶员的输入。在计算领域，直接操作也带来了同样的灵活性。这不是一个小壮举。相比之下，命令行界面很简单。它们遵循一种称为顺序编程的软件范式。每个动作都在系统的控制下按顺序发生。当系统需要特定输入时，系统会提示用户输入。直接操作界面需要不同的方法，因为它们必须根据用户的意愿接受用户的操作。例如，在文本编辑器中操纵hello时，用户可能会将字体更改为Courier（hello），然后将样式更改为粗体（hello）。或者，用户可能首先将样式设置为粗体（你好），然后将字体更改为Courier（你好）。结果是一样的，但动作的顺序不同。这里的重点是用户在控制，而不是系统。为了支持这一点，直接操纵系统是使用一种称为事件驱动编程的软件范式设计的，这种范式比顺序编程复杂得多。尽管事件驱动编程并不新鲜（它过去和现在都用于过程控制以响应传感器事件），但设计异步响应用户事件的系统在20世纪70年代初Star开始工作时还是一种新事物。当然，从用户的角度来看，这个细节无关紧要（记住看不见的电脑）。我们在这里提到这一点，只是为了赞扬为设计Star并将其推向市场所付出的巨大努力。设计Star不仅仅是使用窗口、图标、菜单和指向设备（WIMP）构建界面，而是设计一个可以存在和工作这些组件的系统。由Alan Kay领导的PARC团队从1970年左右开始开发了这样一个系统。核心要素是一种新的面向对象编程语言Smalltalk和一种软件架构Model View Controller。这是一个复杂的编程环境，与Star的设计并行发展。因此，Star的发展跨越了大约10年也就不足为奇了，因为设计师们不仅发明了一种新的人机交互风格，还发明了这种新风格所基于的架构。最终，star在商业上并不成功。虽然许多人猜测了原因（例如D.K.Smith和Alexander，1988），但最重要的原因可能是star不是个人电脑。在Star界面设计师Johnson等人（1989）的文章中，有许多人将Star称为个人电脑。但他们似乎对“个人”有不同的看法。他们将Star视为连接到中央服务器的终端的增强版本，“个人电脑的集合”（第12页）。在另一篇文章中，设计师Smith和Irby将Star称为“为办公室专业人员设计的个人电脑”（1998，17）。“私人”？也许吧，但毫无疑问，Star首先是一个连接到服务器的网络工作站，用于办公环境。而且它很贵：仅工作站就要16000美元。这与我们今天所知道的个人计算相去甚远。这也是一个与20世纪70年代末和80年代初存在的个人计算相去甚远的世界。是的，即使在那时，个人电脑也在蓬勃发展。苹果电脑公司于1977年推出的Apple II取得了巨大的成功。它是开发第一个电子表格应用程序VisiCalc的平台。VisiCalc最终售出了70多万份，被称为第一款“杀手级应用程序”。值得注意的是，Star没有电子表格应用程序，也无法运行市场上任何电子表格或其他应用程序。Star架构是“封闭的”——它只能运行施乐开发的应用程序。
大约在同一时期，其他流行的个人电脑系统包括Commodore Business Machines的PET、VIC-20和Commodore 64，以及Tandy Corp.的TRS-80。这些系统都是真正的个人电脑。其中大多数位于人们的家中。但用户界面很糟糕。这些系统使用传统的命令行界面。

4.HCI的诞生

1983年是HCI诞生的好年份。至少有三个关键事件可以作为标志：第一届ACM SIGCHI会议，Card、Moran和Newell的《人机交互心理学》（1983年）的出版，以及1983年12月提前发布传单的苹果Macintosh的到来。
1983年，第一届SIGCHI会议在波士顿举行。提交了59篇技术论文。会议采用了一个稍作修改的名称，以反映其新的地位：ACM SIGCHI计算系统人为因素会议(ACM SIGCHI Conference on Human Factors in Computing Systems)。自那以后，“CHI”（发音为hard“k”）每年都会举行，近年来约有2500人
CHI会议汇集了研究人员和从业者。研究人员在那里进行技术项目（论文展示），而从业者则在那里了解学术界和工业界的最新研究主题。事实上，这两个团体也在那里与来自世界各地的志同道合的HCI爱好者建立联系（见面和社交）。简单地说，CHI是HCI的活动，对于那些认为HCI是他们领域的人来说，每年参加的朝圣之旅通常是日历上最重要的条目。
虽然年度CHI会议是SIGCHI的旗舰活动，但其他会议都是由SIGCHI赞助或共同赞助的。其中包括年度ACM用户界面软件和技术研讨会（UIST）、专门会议，如ACM眼动追踪研究和应用研讨会（ETRA）和ACM计算机与无障碍会议（ASSETS），以及区域会议，如北欧计算机人机交互会议（NordiCHI）。

5.人机交互心理学

如果有人无意中听到两位人机交互研究人员谈论“Card、Moran和Newell”，那么他们很可能在谈论《人机交互心理学》——这本书出版于1983年，由Stuart Card, Tom Moran, and Allen Newell合著。这本书源于施乐PARC的工作。卡德和莫兰于1974年来到PARC，不久后加入了PARC的应用信息处理心理学项目（AIP）。Newell是宾夕法尼亚州匹兹堡卡内基梅隆大学计算机科学和认知心理学教授，也是该项目的顾问。AIP的使命是“通过在应用背景下进行必要的基础研究，创造人机交互的应用心理学”（Card等人，1983）。本书共有13章，大致组织如下：科学基础（100页）、文本编辑示例（150页）、建模（80页）以及扩展和概括（100页面）。那么，什么是“人机交互的应用心理学”呢？应用心理学建立在心理学的基础研究之上。本书的前100页左右全面概述了基础心理学中与人类感官、认知和运动系统相关的核心知识。在20世纪80年代，许多计算机科学专业的学生（和专业人士）面临着为计算机系统构建简单直观的界面的挑战，特别是考虑到基于GUI的新兴交互风格。对于许多学生来说，Card、Moran和Newell的书是他们第一次正式接触人类感知输入（例如，视觉感知刺激的时间）、认知（例如，决定适当反应的时间）和运动输出（例如，反应并将手或光标移动到目标的时间）。当然，当时对人类感官、认知和运动行为的研究已经发展得很好。Card、Moran和Newell所做的是将低级人类过程与人类与计算机之间看似无害的交互（例如，打字或使用鼠标）联系起来。其框架是模型人类处理器（model human processor,MHP）。MHP有一只眼睛和一只耳朵（用于感知处理器的感官输入）,一个大脑（具有认知处理器、短期记忆和长期记忆），以及手臂、手和手指（用于运动反应）。
心理学和计算机科学之间的一个有趣的协同作用——这在书中得到了很好的体现——是人类行为可以被理解，甚至被建模为一种信息处理活动。在20世纪40年代和50年代，香农（1949年）、霍夫曼（1952年）和其他人关于通过电子渠道传输信息的工作很快被米勒（1956年）、菲茨（1954年）和威尔福德（1968年）等心理学家采用，作为表征人类感知、认知和运动行为的一种方法
在这里插入图片描述
心理学和计算机科学之间的一个有趣的协同作用——这在书中得到了很好的体现——是人类行为可以被理解，甚至被建模为一种信息处理活动。在20世纪40年代和50年代，香农（1949年）、霍夫曼（1952年）和其他人关于通过电子渠道传输信息的工作很快被米勒（1956年）、菲茨（1954年）和威尔福德（1968年）等心理学家采用，作为表征人类感知、认知和运动行为的一种方法。

Card, Moran, and Newell将人类行为的信息处理模型应用于交互系统。这本书中最突出的两个例子是希克选择反应时间定律（Hick’s law for choice reaction time，1952）和菲茨快速瞄准运动定律（Fitts’ law for rapid aimed movement，1954）。

Newell后来反思了《人机交互心理学》的目标：我们认为界面设计师需要一个理论。界面设计是人机交互的杠杆点。人的因素和人机心理学对实验的经典强调分析要求系统或合适的模型可用于实验，但当这样一个具体的系统存在时，界面中的大多数重要自由度都已受到限制。设计师需要的是思考工具，这样在设计时，用户的属性和约束就可以在做出重要选择时发挥作用。我们的目标是开发一种工程风格的用户理论，该理论允许对用户在终端操作时如何与计算机交互进行近似的、粗略的计算。

这里有一些有趣的地方。首先，Newell敏锐地发现了该领域的一个困境：实验要等到为时已晚才能进行。正如他所说，系统已经建立，自由度受到限制。这或许有些言过其实，但确实，新产品中的新颖互动似乎总是伴随着一系列研究论文，这些论文发现了弱点，并提出和评估了改进措施。然而，故事还有更多。考虑一下苹果iPhone的双指手势、任天堂Wii的加速感应手势、微软IntelliMouse的滚轮或Palm Pilot的文本输入手势（又名涂鸦）。这些“创新”并非源自工程或设计才华的新鲜想法。这些突破以及更多的突破都有背景，而这种背景就是人机交互和相关领域的基础研究环境。对于刚才引用的例子，这项研究早于商业化。研究本身就需要通过出版物传播。因此，像CHI这样的会议和《人机交互心理学》这样的书籍是发现和产生新的、令人兴奋的交互技术的沃土，这并不奇怪。Newell还指出，这本书的一个目标是生成“思考工具”。这是对模型——交互模型的随意引用。这些模型可以是定量和预测性的，也可以是定性和描述性的。不管怎样，它们都是工具，雕刻家的刀，鞋匠的针。无论是在替代设计选择中生成定量预测，还是划定问题空间以揭示新的关系，模型的目的都是梳理假设设计中的优缺点，并引出改进设计的机会。这本书包括一些示例，如击键级别模型（KLM）和目标、运算符、方法和选择规则模型（GOMS）。这两个模型在早期的工作中都有提出（Card、Moran和Newell，1980），但在书中再次提出，并进行了额外的讨论和分析。然而，这本书在建模方面的主要贡献是令人信服地证明了模型为什么以及如何重要，并教我们如何构建模型。

6.人机交互和图形用户界面（GUI）的增长（Growth of HCI and graphical user interfaces (GUIs)）

随着1983年ACM SIGCHI的成立和1984年苹果Macintosh的发布和成功，人机交互开始流行起来。GUI进入主流，因此，更广泛的用户和研究人员社区接触到了这种新的交互类型。微软是GUI领域的后来者。微软Windows的早期版本出现在1985年，但直到Windows 3.0（1990年），特别是Windows 3.1（1992年）的发布，微软Windows才被认为是Macintosh操作系统的重要替代品。微软通过改进版本的Windows增加了其市场份额，最明显的是Windows 95（1995）、Windows 98（1998）、Windows XP（2001）和Windows 7（2009）。如今，微软台式电脑操作系统的市场份额约为84%，而苹果为15%。随着人们对人机交互的兴趣日益浓厚，所有主要大学都开设了人机交互或用户界面（UI）设计课程，研究生经常选择人机交互的主题进行论文研究。许多这样的学习项目都在计算机科学系；然而，人机交互也成为心理学、认知科学、工业工程、信息系统和社会学等其他领域的合法和流行的焦点。不仅仅是大学认识到了这一新兴领域的重要性。公司意识到设计好的用户界面是件好事。但这并不容易。HCI中有很多关于糟糕UI的故事（例如，Cooper，1999；Johnson，2007；Norman，1988）。所以还有工作要做。从业者——即在行业中应用人机交互原则的专家——是人机交互社区的重要成员，他们在当今的许多人机交互会议上都是一支重要的队伍。

7. HCI研究的增长

人机交互的研究兴趣，至少最初是在界面的质量、有效性和效率方面。与基于文本的命令行界面相比，人们使用GUI执行常见任务的速度和准确性有多快？或者，给定GUI实现中的两个或多个变体，哪一个更快或更准确？这些或类似的问题构成了HCI早期许多实证研究的基础。今天也是如此。人机交互研究主题的一个经典例子是菜单的设计。使用GUI，用户通过从菜单中选择命令而不是在键盘上键入命令来向计算机发出命令。
众所周知，在用户界面中，识别比回忆更受欢迎（Bailey，1996，第144页；Hodgson和Ruth，1985；Howes和Payne，1990）【在用户界面设计中，相对于让用户回忆某些信息（recall），更倾向于让用户能够轻松地识别这些信息（recognition）。换句话说，用户界面应该提供明确的选项或信息，让用户能够通过识别来选择，而不是依赖于记忆去回想信息。】，至少对新手来说是这样，但随后出现了一个新问题。如果菜单中有许多命令，应该如何组织它们？一种方法是在包括深度和广度的层次结构中组织菜单命令。问题来了：什么是等级制度的最佳结构？考虑在菜单中组织64个命令的情况。菜单可以按深度=8、宽度=2或深度=2、宽度=6进行组织。这两种结构都提供对64个菜单项的访问。强调广度的情况给出了8^{2=64个选择。深度强调案例给出了2}6=64个选项。哪个组织更好？另一个组织更好吗（例如，4^3=64）？鉴于这些问题，菜单设计问题在人机交互早期作为研究课题被积极研究也就不足为奇了.

深度与广度并不是菜单设计中唯一的研究问题；还有许多其他的。物品应该按字母顺序还是按功能排序（Card，1982；Mehlenbacher，Duffy和Palmer，1989）
子菜单上的标题是否会改善菜单访问（J.Gray，1986）
如果在标签上添加图标，访问权限是否会得到改善（Hemenway，1982）
不同年龄段的人对宽菜单等级和深菜单等级的反应是否不同（Zaphiris、Kurniawan和Ellis，2003）
移动设备上的菜单是否具有深度与广度的优势（Geven、Sefelin和Tschelig，2006）
听觉反馈是否改善了菜单访问（赵、德拉吉切维奇、奇格内尔、巴拉克里希南和鲍迪施，2007）？手机的倾斜可以用于菜单导航吗（Rekimoto，1996）
菜单列表可以是饼状的，而不是线性的吗（Callahan、Hopkins、Weiser和Shneiderman，1988）
馅饼菜单可以用于文本输入吗（D.Venolia和Neiberg，1994）
这些研究问题的答案可以在引用的论文中找到。它们是为人机交互实证研究创造机会的研究问题的例子。人机交互领域有无数这样的研究课题。虽然我们在本章中看到了很多，但我们会在接下来的章节中发现更多。

8.其他阅读

另外两篇在人机交互历史上被认为很重要的论文是：
“Personal Dynamic Media” by A. Kay and A. Goldberg (1977).。本文介绍Dynabook。尽管从未建成，但Dynabook为笔记本电脑、平板电脑和电子书提供了概念基础。

The Computer for the 21st Century” by M. Weiser (1991)。这是一篇预言普适计算的文章。Weiser开始说：“最深刻的技术是那些消失的技术。它们将自己融入日常生活的结构中，直到与日常生活无法区分”（第94页）。

9.资源

以下在线资源可用于进行人机交互研究：
The following online resources are useful for conducting research in human-computer interaction: l
谷歌学术Google Scholar: http://scholar.google.ca
ACM数字图书馆ACM Digital Library: http://portal.acm.org
HCI参考文献HCI Bibliography: http://hcibib.org
本网站可作为本书随附的资源This website is available as a resource accompanying this book:
www.yorku.ca/mack/HCIbook
本文提供的示例附带了许多下载 Many downloads are available to accompany the examples presented herein.