对儿童用户的可用性测试指南

child-ut-00

题目:Guidelines for user testingwith children
作者:Wolmet Barendregt, Mathilde M.Bekker
来源:Department of IndustrialDesign, Eindhoven University of Technology

 

本文对如何进行儿童(约五至七岁)用户测试(电脑游戏)进行了概述。实验地点是在埃因霍温科技大学实验室和学校。在易用性实验室孩子们这个年龄组的许多孩子的经验。文章正是讨论了实验的制备方法,比如在测试中如何与儿童互动和测试所需评价者的数目。

前人对于成人用户测试已经有很多的研究,近来对于儿童用户测试给予了越来越多的关注度。Hanna, Risden, and Alexander建立了一套儿童用户测试指南,这套指南还仍然是针对这一问题展开为数不多的且被经常引用的文章。本文将会对儿童用户测试进行补充和优化,为了轻松地和前人的研究建立联系,文章的行文组织方式和他们的保持一致。研究内容首先是设计和制定实验方案,然后按照实验方案进行实验,然后对实验进行归纳分析,文章最后简单讨论了这个实验分析所需评价者的数目。

 

一、实验设计

被试数目

设计儿童用户研究的第一步就是决定实验需要的被试数目。许多研究已经表明前面第三到五参与者就足以发现80%的可用性问题。方程式1 − (1 − p)n,n代表给定问题的实验被试的数目,p代表给定的问题的检出率。这意味着三个被试对应给定问题的检测率需要高达0.42,五个被试对应给定问题的检测率需要达到0.28。

一般来说实验的检测率都比较低,需要更多被试来发现所有给定问题的80%。我们的儿童用户实验也同样如此,平均检测率保持在0.12到0.14,由下表可知至少需要11到13个儿童被试才能发现80%的问题。

child-ut-01

图1 检测问题的百分比在三种不同的检测率下随着被试数目增加的变化率

即使只由一个被试来解决所有给定问题,检测率也在0.19,这说明八个儿童就能检测出80%的问题。至少有五个,最好大于五个孩子会发现的问题的百分比要高得多。此外,使用五个或更多的参与者还给出了问题的严重性更清晰的印象。然而,即使一个孩子总是比没有孩子要好。

 

选择儿童被试

尤其是当实验的预算很少,没有足够的儿童参与到实验中来,如何从儿童被试中获取更多的信息尤为重要。包括如何使儿童体验更多问题和用语言表达更多信息是优化儿童测试输入的好办法。

我们的研究表明,通过对个性特征限定打分来预测哪些儿童可以体验更多的问题,哪些儿童可以用语言表达更多问题。通常的个性特征限定由五个主要特征组成分为十八个子特征。例如子特征“好奇心”对应的主特征“智商”是对体验更多问题能力的良好指标,而“外向”和“友好”两个主要特征的组合是语言称述问题能力的良好指标。

我们的测试问卷使用的是叫做Blikvanger的问卷,当然这份问卷所评价的用户特征也可以通过询问父母得知他们的孩子是否好奇,是否外向,或者是否足够友好。但是这些特征需要从孩子们的行为层面清晰地向父母表达。比如“不友好”这一项可能会对父母来说是一个消极含义,但是它可能意味着孩子对事物保有批判态度并愿意表达这种态度而推动其发展,从这个角度来看,便少了许多消极意味。

 

孩子们在实际测试之前的准备练习

测试问卷的数目和类型可以通过孩子们在测试前练习试玩游戏的时候而得出。

另一个实验是有关知识和对常见问题的判断,涉及到知道怎么去做,理解反馈。当孩子们练习试玩游戏的时候操作性问题出现得十分频繁,这些问题往往是由与解释和反馈占用太长时间,或者中途被打断造成。此外,首次使用遇到太高难度的挑战也会给孩子们带来困难。

因为很多知识性问题很困难需要寻求别人的帮助孩子们才能克服他们,所以在第一次接触游戏就进行实验比之后进行实验更重要。操作性问题仅仅是个小烦恼可以通过启发式引导如“讲故事”,解释,和中途打断反馈。除非是第一次使用游戏才能被给予启发式引导,讲故事、解释和反馈也要尽可能的简短。所以,在儿童已经对游戏产生了一些经验之后再进行操作性实验检测,获得的回报就很少了。

挑战有时可以成就一个游戏有时也可以毁灭一个游戏,这些都是在恰当合适的挑战难度之间的微妙权衡。为了确定某个部分的挑战难度是否适宜,可以通过让孩子反复进行这部分的实验来检测。

 

使用图片卡的方法

我们提出图片卡的方式来帮助孩子在测试过程中明确表达更多的问题。它的本质是一个盒装的图片卡集,象征着孩子们游戏过程中可能遇到的各种问题,这些图片卡起到解释实验的目的和测试中提醒的作用。最后,图片卡可以让那些不善表达的孩子用非口语化的方式更加清晰的描述问题,方法就是通过把卡片放在不同盒子里。研究表明孩子们通过这种图片卡比没有图片卡能更加清晰的称述更多的问题,而且孩子们都很喜欢这种图片卡的方式。

child-ut-02

图2 图片卡箱,用图片的方式描述儿童在测试过程中遇到的不同类型的问题

在实验中我们推荐使用图片来解释从儿童那里获得的信息,因为这种方式能在实验中更容易的抓住儿童的注意力。主持人能在介绍过程中更好地引导儿童并与之建立融洽的关系。此外,我们也强烈推荐这种图片卡作为一个暗示提醒的介质来紧紧的抓住儿童在实验过程中的注意力焦点。然而,让儿童反复从盒子里取卡放卡的方式会花费很多时间而且容易分心,并不是很可取,应该采用其他干扰程度较低的方式来选择图片。

 

二、实验说明

使用协议书

实验协议书以书面的形式把用户在实验过程中需要遵守的一些规则在实验前声明,但是这对于儿童测试却显得过于严肃,会让儿童感到紧张和不自然,甚至让儿童变得沉默不积极,所以这并不是你想要的效果。只有经过多次实验让儿童慢慢变得适应而不必担心她需要以何种正确的方式来说出她所感受到的东西,这对于与你面前的儿童建立亲近的关系也能起到很好的作用。

 

三、实验过程

使用发声思考和协议

发生思考的技巧方式常常用在成人测试中,用来让参与者口头上说出她/他在使用产品时是如何思考的。年幼的儿童可能并不擅长发生思考。其中一个原因是,她是一种不自然的交谈方式,特别是自言自语。在测试中让一些儿童大声的说出他们是如何想的,他们会说“那我是在对谁说的呢?对你吗?”。这个例子来自Boren 和 Ramey研究中,很明显的说明了人们总是需要一个对话和合作伙伴,才能进行发声思考。因此主持人应该自然回应儿童的话而没有任何偏见。例如,达到一个子目标时,孩子往往很热情,他们会说这样的话:“我这样做很好,不是吗?”通常情况下,我们应对此作简短回应,尽量保持儿童沉浸在游戏中的状态,比如:“嗯!非常好!”。

在测试开始前主持人应该写下适当的方式来回应儿童以避免偏见和不同的处理办法。然而,与年幼的儿童进行实验情况总是非常的不可预测。有时儿童会哭闹,或说到健康问题,或问到其他儿童的情况。主持人应该对此做好事先的准备并即兴发挥,因此严格遵照实验协议书是不可能的也是不可取的。例如,我们研究中的大多数实验,如果儿童不反复的询问是无法获取帮助的。然而,在一次首次实验中有个小女孩盯着屏幕看了很久,当主持人最终问她是否知道应该做什么的时候她开始大哭并表明她不知道该做什么。为了平复她紧张的心情主持人拿过鼠标告诉她将和她一起玩游戏。当小女该感到舒缓多了之后再告诉她应该做什么,她移过鼠标开始独自玩游戏。在这个例子中主持人没有严格的遵照协议书,但是我们认为实验的其余部分仍然是非常有价值的。

另外,企图使沉默的孩子发声也不是总有效果的。有时一些孩子的回应是否有效也有待怀疑,因为他们很可能是为了回应而回应你,简单的回复你一些又继续保持沉默。

 

给予帮助

儿童在不理解怎样进行下一步操作或者不知道将会发生什么的时候,他们会变得十分伤心。儿童遇到困难就会求助,这时主持人也会忍不住去帮助他们。总之,这是不可避免的事。但是主持人应该首先确保儿童尽可能多一点的尝试,这有利于确定问题的严重程度。另外,主持人也应该确保给予适度的帮助。举例来说就是主持人应该确保儿童首先明确游戏的目标继而得知应该采取何种行动去达到这个目标,以及相应的反馈代表什么意义。

 

任务和自由发挥

我们的一个实验表明,为了检验电脑游戏在真实环境中的可用性和享乐性问题,有必要允许儿童自由的玩游戏,至少在部分测试环节,相对于机械的执行任务可以让儿童自由发挥。对一些特定功能可以添加一些小任务,例如儿童是否知道如何把音量调低。然而,给予任务的风险是,他们可能会因为找不到信息而放弃游戏。例如,在《米洛与魔法石》有一个地图可以很容易一个地点定位到另一个地点,不需要重复已完成的游戏。虽然在游戏介绍中有提示,大多数儿童不知道这个功能而感到沮丧,一遍遍的反复游戏已到达之前访问过的那个界面。有一个任务是,找到一个地图然后使用它,做完这个任务之后儿童就不再产生挫败感了,当然这个任务只能在一段时间的自由游戏之后给出。

 

阅读

在这个年龄段的孩子开始学习阅读。虽然主持人有时会想跳过一些东西直接阅读它给孩子听,因为它的速度更快,但是如果你不要让他们尝试自己读取,会令孩子非常沮丧。接受这样事实:测试过程中真正有用的测试持续的时间只占及其短的一部分。

 

三、实验结束

让孩子停止

在测试即将结束时,孩子需要停止游戏。比如要回答一些问题,或者另一个孩子已经在等着了。尤其是游戏有时很难让孩子停下来。当测试快要结束的时候,要提醒孩子不得不停止游戏一会儿,语气要坚定说一些类似:“我们只是等一会再玩”,有时善意的欺骗孩子说直到某个小任务完成之后才能继续玩游戏也是很有用的办法。

问卷调查

通常,测试环节后可能有必要问孩子一些问题,例如他们认为这个游戏整体上如何或者他们希望如何参加测试。不幸的是,在测试结束后询问孩子们这些额外的问题是困难的。往往孩子在你已经让他们停止玩游戏后就不想花太多的时间在实验室里。因此,问题应该是简短和简单的,不应该有很多问题。

礼品

为表谢意,通常给参加测试的孩子们一些小礼物。如果您打算这样做,确保你有准备好一些额外的礼物。家长往往会带兄弟姐妹或朋友来实验室,如果他们不能得到一份礼物,这将是令人失望的。

如果你想给孩子吃的东西,准备一些替代品给那些不能多吃小麦,牛奶,巧克力,糖,花生等的孩子避免过敏物质。要是在学校而不是可用性实验室进行测试,最好是给全体准备礼物,而不是个别儿童。这样一来,那些不能来参与或者因为父母不允许来参与测试的孩子就不会太失望。

评估员数目

Jacobsen等人已经描述过,在可用性测试阶段单一的评估人员在录像分析中不能发现的所有问题。这对于儿童用户测试的分析也成立,并且这是我们研究分析大多数是由两个评估员组成的原因之一。还有另外一个原因是,年幼的孩子往往不擅长发生思考。因此,评估员需要解释很多非语言的行为和不完整的模糊的句子。当单独执行这些评估员通常是无法确定问题的确切所在或是否有其他的观点。与其他评估员讨论某些行为和言语表达的细节能创建更清晰的问题报告,绝对是值得的。

 

四、致谢

该研究是由荷兰政府的创新型研究计划的人机交互实验室(IOP- MMI)支持完成。

 

 

文章编译来源:信息交互设计与用户体验创新
顶部图片来源:http://www.ummchealth.com
 

 

 

订阅
提醒
guest
0 评论
Inline Feedbacks
View all comments