即墨开展平台业务培训 推进教师管理数字化
2026-06-15
2026-06-20 0
2018年,亚马逊邀请我担任Astro项目的首席用户体验音效设计师。Astro是亚马逊推出的首款面向消费者的家用机器人,它能够利用摄像头和传感器对家庭环境进行建图和导航,主动巡逻、查看家人状态,并通过内置货仓搬运小型物品。尽管产品功能和外形设计已经相当明确,但最初并没有任何关于机器人性格的方向性定义。甚至在Astro还没有名字的时候,团队就面临一个核心问题:它只是装了轮子的Alexa,还是一个拥有独立个性的机器人?

Astro团队内部为此产生了分歧。一派认为应该主打Alexa品牌,把移动机器人定位为附加功能工具。我和大多数用户体验团队成员则坚持反对这一方向。我们的判断是:一个能够在你家中移动、带着意图转向你的机器,永远不可能只是一台家电。无论我们是否有意为之,用户都会赋予它某种性格,因此唯一的问题是:我们主动塑造这种性格,还是让它自然而然地随机生成?
最终,Astro以独立形象而非Alexa的延伸面世,用户测试也印证了这一决定。测试者并不把它看作Alexa,而是视其为有独立个性的存在,他们也更希望它是这样的角色。让Alexa驻留在Astro设备上的感觉有些怪异甚至令人不安,但在当时(2018年)为Astro单独打造一套语音系统又太耗时、成本太高。于是我们达成折中方案:Alexa作为辅助角色负责实际对话,而Astro作为主角,通过声音、动作和面部表情,在尽可能不依赖语言的情况下进行表达。
我最初被引入Astro团队,是为了定义机器人的音效设计语言和声音风格。但当时没有人负责真正充实机器人的性格内核。没有清晰的性格定义,就无法做出任何真实有效的设计决策。Astro的每一个动作方式、音效选择、停顿节奏、情绪反应,都是性格的体现,而这些选择需要所有设计方向共同协作。作为音效负责人,我的工作是将声音、动作和角色性格编织在一起,让它们在每个叙事时刻和谐共鸣。负责编排Astro动作和面部表情的动画师们技艺精湛,但他们所呈现的情感弧线,是从声音(也就是性格)工作中生发出来的。于是我主动承担了这个角色,真正的挑战也由此开始。我从这段经历中获得的关于为机器人塑造性格的认知,几乎适用于当下所有具身AI产品的开发实践。
为Astro打造性格,意味着要回答一系列亚马逊产品团队从未面对过的问题:这款机器人的基准情绪范围应该有多宽?它如何在不削弱用户信任的前提下表达不确定性?富有表现力和令人烦躁之间的边界在哪里?这款设备在性格上有哪些潜在弱点?
这些都是真实的设计问题,有其具体答案,所有参与产品的团队都必须从这些答案出发来构建各自的工作。以Astro的情绪范围为例,我们将其设计为相对克制。我们不希望Astro表现得过于悲伤或愤怒——它可以流露出悲伤的情绪,但会迅速从中恢复,并以一个积极的音符作为结尾,始终保持整体基调的温暖。
性格会从产品每一个细节的缝隙中渗透出来,一旦定义不准确,就会造成割裂的体验。即便只是动画时序稍有偏差,或某个回应在技术上正确但情境上不合时宜,用户都能感知到这种不协调,即便他们无法明确说出原因所在。
我们决定Astro不使用口语对话,但它拥有功能等同于语言的表达体系:一套由声音、音调和节奏构成的词汇库,充当着它的声音。这套词汇库成为性格输出的核心媒介,机器人的动作和面部表情都围绕它来构建。
Astro的唤醒序列是一个很好的例子。唤醒不只是屏幕上的开机动画,而是一场完整的表演。起初,机器人缓慢而谦逊地让自己安静地定向,然后伸展屏幕、检查轮子,最后以一个向上的姿态拉起伸缩桅杆,轻轻弹出,做了一个欢快的小舞蹈。声音、动作和眼睛在完整的编排中击中了每一个节拍。
这个序列的性格输出,首先是以故事的形式写就的:Astro第一次在新家醒来。它最深的渴望是成为一个家庭的一份子,所以这一刻是它一直在等待的,是它存在的意义。作为一个负责任的角色,它希望在介绍自己、开始探索新家之前,先确认一切是否运转正常。
这个叙事先于一切,因为它驱动了后续所有的决策。故事写好之后,声音赋予了它隐喻性的表达:兴奋的音调、检查轮子时的节奏,以及Astro第一次抬头望向新家人时那段明亮的旋律短句。声音铺设完成后,动画师再用动作和面部表情跟进,以声音所建立的情感弧线为线索展开创作——动作不是领导者,而是追随着故事与声音的情感走向,就像动画师跟随录音的方式一样。
那段唤醒序列成为早期用户测试中被讨论最多的时刻之一。用户用"有生命"来描述它。他们感受到的,不是某一个单独的元素,而是声音、动作和面部表情三个通道共同表达同一个清晰定义的性格时所产生的和谐共鸣。
最能打动人的角色,并非由固定的情绪状态定义,而是由它如何回应所处环境和身边的人来定义——即便在不断适应中,它依然是那个辨识度极高的自己。这就是我所说的情境性格。一个生活在家庭中的机器人,不会只占据单一的情绪状态。它穿行于不同能量的房间,遇见处于不同情绪的人,在一天的不同时段运行,应对无穷无尽、从未被明确设计过的社交场景。
在Astro的声音设计中,我们在情境性格输出上已经相当接近目标。当特定的环境信息被输入系统时,它的适应表现令人印象深刻,Astro感觉完全鲜活。但这些状态的背后,依然是我们逐一手工预判的结果——我们必须提前设想每一种情境,并为其设计回应方案。而一个真实的家庭会向机器人抛出任何人都无法穷举的情况,所以系统总有准备不足的时刻。
人们用"聪明"来描述一款产品,和用"有感知力"来描述它,差距往往正在于此。聪明是能力,感知是上下文,而在场感是性格——性格始终是对周围的人、对环境、对自身变化状态的回应。这才是让用户感到"有某种情感存在与你同在"的根本所在。
这正是AI为性格设计带来的游戏规则改变之处,远超Astro时代所能实现的一切。AI驱动的适应能力不再依赖我们曾经仰赖的情境预判,它能够学习与它共同生活和工作的人的具体节奏、偏好和情感语境。性格不再只是回应情境,而是在情境中不断成长。
当下即将涌现的具身AI产品浪潮中,产品的性格与灵魂几乎总是事后才被想到的。而定义得太晚的性格,就等于没有定义。它变成了无数小决策的总和——由不同的人做出,每个人想的都不是性格本身。人们会不由自主地向设备投射性格,尤其是会移动的设备——一个能动的机器人,本身就已经是一个角色。如果没有人设计这个角色,结果就会是那些毫无感觉、甚至令人困惑和缺乏信任感的产品。技术上令人印象深刻,但毫无生气。
我们在Astro上并没有完全做对这件事。太多工作在并行推进,性格很少被当作一种基础能力来对待,这也情有可原。当你在构建一款史无前例的产品时,最响亮的永远是那些出问题的东西、截止日期、成本,以及用户能在包装盒上指认的功能。性格比这一切都要安静,很容易让人觉得可以之后再说。在亚马逊Astro这样体量的团队里,一个想法能进入路线图,本来就要和数百个在当下看来都更紧迫的事情竞争。这一切并非源于没有人在乎,而是因为性格这件事,往往要等到你看见它缺席的代价,才会真正被放在优先位置。
如果你正在构建一款将与人共享物理空间或对话空间的产品,有三件事值得认真思考:
在定义交互之前先定义性格。你需要一个有足够情感逻辑支撑的、经得起推敲的性格定义,以便始终如一地回答那些难以回答的问题。尽早找到性格问题的答案,让每个设计方向都从同一个基础出发来构建。
将故事和声音纳入性格开发流程,而不是留到生产流程再处理。在性格定义阶段同步开发故事和声音,才有机会真正影响动作、表情和交互逻辑的走向。这需要一种不同的协作方式,也需要一种不同类型的人才。
为适应性而设计,而不仅仅是为一致性而设计。一致的性格是必要的,但那些真正在人们生活中留下重量的产品,是那些随着使用而不断深化的产品。支撑这一点的技术基础越来越触手可及,但能够真正加以利用的设计思维,依然稀缺。
Q&A
Q1:亚马逊Astro的性格设计为什么不选择直接沿用Alexa?
A:团队认为,一个能在家中移动并带着意图转向你的机器人,永远不可能只是一台家电。用户会自然地对它投射性格期待,测试也证明用户并不把Astro视为Alexa,而是期待它拥有独立个性。Alexa驻留在Astro上的感觉显得怪异,而为Astro单独开发语音系统在当时成本过高,因此选择了Alexa作为辅助对话角色,Astro作为主角通过声音、动作和表情进行非语言表达。
Q2:Astro的唤醒序列为什么被用户反馈为"有生命感"?
A:因为唤醒序列是基于一个明确的叙事故事设计的,声音先行确立了情感弧线,动画师再根据声音的节奏和情绪进行动作和表情创作。声音、动作和面部表情三个通道同步表达同一个定义清晰的性格,而不是各自独立运作,这种和谐共鸣让用户产生了"活着"的感知,而不是在看一段视频片段播放在机器人上。
Q3:为什么具身AI产品的性格设计总是被推迟,该怎么避免这个问题?
A:性格不像功能故障或截止日期那样紧迫,容易被认为可以"之后再做"。在大型团队中,性格还要和大量更显眼的需求竞争优先级。要避免这种情况,应在定义交互之前先确立性格框架,将故事和声音设计纳入性格开发阶段而非留到生产阶段,同时要为适应性而设计,让产品性格能随使用深化,而非仅仅维持表面一致。