在这个被忽视的技术中,我发现了许多团队的突围机会
01 一个意料之外的设计变量
语音系统,可能是最不起眼的游戏功能之一。但现在,情况变了。
最近的社交媒体上,一位玩家在 ” 你最近最喜欢的游戏是什么 ” 的问题下提到,他近期沉迷玩一款名为《Dark and Darker》的游戏,尤其当它重新引入了全新的语音系统(VoIP)后,游戏体验变得更好了。
相似的现象在也出现在《Suspects: Mystery Mansion》。开发者去年在相关媒体账号上指出,游戏迭代了一次语音系统后,哪怕玩家不戴耳机,其游戏体验也能得到提升。开发者对提升幅度描述为 ” 彻底 “。
如果你在社交媒体上搜索上述产品 +VoIP 的词条,能看到玩家对语音系统清一色的喜爱。某款产品测试阶段上线该系统后,有 KOL 专门为此制作了视频,不吝溢美之词地称赞语音体验;有玩家回复,游戏前后体验能好上 “10 倍 “。
这一现象并不寻常,毕竟很少有玩家会提到游戏声音的优劣。
游戏声音的评判比较尴尬,它既难被玩家捕捉,也难被开发者确切描述。一位大厂音频总监曾告诉我,他们此前靠用户调研判断工作成果,只要 ” 没人提音频不好 “,便证明工作做对了方向。
语音系统更为边缘,它甚至难算作游戏音频。过往,语音更接近附加功能,与游戏所需的社交程度挂钩。如果语音需要被添加,它通常不是由音频部门负责,而是交由客户端来开发。这是一个较为基层、难出彩的功能模块。
而如今,语音模块正切实地在数款产品身上带来了超预期的市场反馈,甚至成为部分产品影响玩家体验的关键因素——这些产品的共同特点,就是使用了腾讯云音视频 GME 与 Wwise 独家合作的语音方案。
根据玩家、KOL 对上述两款产品的评价,这套全新的语音系统已成为游戏音频的一部分。
在《Dark and Darker》KOL 发布的相关视频中,一位深处在洞穴的玩家向主播求饶时,他的声音不仅有方位感,还自带混响,好像那个玩家是真在逼仄的洞穴中说话一样。
在《Suspects》里,玩家语音有传播范围,太远了听不见,还有可能被墙壁隔开——玩家在被其他人追杀时,为了及时告诉其他人自己有危险,得跑来跑去,大声呼喊才行……
通常,游戏声音要有信息,也要有 ” 身临其境 ” 的感受。游戏声音为了沉浸感,会实时做混音。例如,当一位玩家走路的时候,另一位玩家可以根据脚步声就能判断另一位玩家是在楼上还是楼下,是在木板上还是外面的石子儿路上,距离有 5m 还是 10m ……
而传统语音功能简单,玩家开麦只为了传递信息。语音更接近于一个独立社交系统,与游戏内容本身的联系并不大。很多游戏一开麦,就像是拨通电话一样,让玩家的声音和游戏格格不入。
——很明显,上述两个产品案例的语音多了临场感的那一面。
《Dark and Darker》就是一个典型案例。
《Dark and Darker》的语音与游戏声音就融合在了一起。当玩家在游戏开麦说话的时候,语音会根据玩家所处的环境,完成混音,让听到语音的玩家能立刻知道说话人究竟在什么位置,或者身处在什么样的空间。
听起来并不特别?但玩家的体验却因此发生了许多变化:大家开始更频繁地和陌生人聊天,就为了能听听声音在地下城里的回声;语音还带来了紧张刺激的感觉,强化了某些场景的表现力;一些主播喜欢这种沉浸感,时不时会戏精上身,玩起角色扮演……
其实仔细梳理游戏设计,《Dark and Darker》并没有为语音额外增加玩法设计,或是为其改变关卡,但仅是让语音多了沉浸感的设计,就已经让玩家们的体验发生变化,甚至改变了其游戏的方式——说实在一些,这一改动的性价比很高。
这种沉浸感还有许多额外的加持。比如,GME for Wwise 功能还使语音更清晰,不割裂,就像在游戏环境之下的面对面对话;再比如,组队玩家可以应用彼此熟悉的变声特效,既区分了队伍,也多了趣味性。
而在不久前,语音系统还只是一个距离游戏设计很远的边缘功能模块。而如今,它正在借助新的语音技术,跻身到游戏音频的设计范畴,开始启发团队立项方向,影响玩家的游戏体验。
但这一变化是什么时候开始的?
02 从边缘功能,变成核心的一部分
在刚看到有关语音的称赞时,我其实也不以为然。这与行业对语音的传统认知有关。
语音的边缘性,部分来自其功能定位。语音对很多产品都很重要,但它在生产流程上鲜少被重视,大部分团队认为,等所有设计完成后,再额外添加上语音功能就好。这也忽视了语音质量对游戏的影响。
语音的功能定位,也使其更多交由三方团队开发。研发组不需要耗费太多时间去自己做一个语音系统,而是寻找三方团队的解决方案,植入项目就行。一位音频总监提到,他们针对语音系统的工作只有屏蔽词设定。
也因此,语音模块距离游戏设计一直很远。
最早,国内语音功能就独立于游戏,依赖三方聊天软件。在《魔兽世界》《传奇》《QQ 炫舞》等产品的社交环节,许多玩家会额外挂 YY 等语音软件,和朋友一起聊天打本。语音模块时常会脱离游戏,接近另一个社交场景。
后来,语音模块逐步融入游戏,与部分品类绑定在一起。这部分需求在手游发展较快的阶段颇为明显,由于手游聚焦操作,所以玩家难做太多社交动作,比较依赖游戏内即时语音系统。也在此时,GME 项目开始推进。
2017 年,GME 开始推出语音解决方案,提供 SDK 及基础 API 来帮助游戏厂商做游戏内的语音系统。根据相关信息,GME 是腾讯云音视频旗下产品,它最初诞生于 QQ 音视频实验室,用以支撑内部产品,后对外开放,向外部游戏厂商提供语音方案。
成立早期,GME 核心战略是做一站式方案:
● 这套语音方案要极简,仅需 4 行代码就能使用功能;
● 它有腾讯云音视频的技术优势,足够稳定安全,兼容移动、PC 等多端平台,并且是索尼与任天堂主机平台官方授权的语音插件;从 17 年适配 unity 起,到如今最新 UE5、PS5、XboxSeries 的适配,SDK 越发成熟稳定;
● 更重要的是,它集成了大量语音功能,能做基础的音文互转、语言翻译,也能做更高级的识别特定游戏术语、录制音频存档、极速语音条等,还因覆盖游戏品类的广度与深度,而优化迭代了较多语音管理相关的能力……
但语音始终是边缘功能,因为鲜被重视,它一直有一个未被解决的 ” 顽疾 “。
手游平台的语音一直存在一个割裂游戏体验的问题:玩家一开麦克风,游戏声音就会如电话音一般,让体验割裂。不过由于语音一向如此,很多人都觉得它是无法避免的,甚至鲜有人将其视为痛点与 GME 沟通。
简单来说,此前语音想要变得清晰,依赖硬件调试,它得去手机的通话功能里才能降噪,并消除回声。但这一调用,原本走电影音乐播放通道的游戏声音,会一同被带到通话音质。这也让游戏一开麦,音质就变差。
如果要解决这个问题,就得想办法让语音不依赖硬件,在软件层面去做降噪和回声消除。而在过往的传统方案里,语音之所以没往这方向考虑,便是因为边缘性,它很难拿到游戏的音频信号。
2018 年,GME 希望解决这个问题,他们前往加拿大与 Audiokinetic 的 Wwise 联系——这是全球覆盖范围最大的游戏音频引擎软件——寻找解决方案。他们一开始的策略很简单,就是借助音频引擎从软件层面提升语音质量,让它不会割裂游戏体验。
但合作起初并不顺利。Wwise 觉得这事没什么必要,它服务的海外产品以 PC、主机产品为主,没有听到太多用户关于手游的语音体验反馈——也是在沟通中,GME 意识到,语音除了提高声音品质,它在游戏引擎里其实可以做更有价值的功能。
从结果来看,GME for Wwise 方案是将语音做成了游戏内的一个事件。一方面,语音完成降噪和回声消除,让游戏保持媒体音量,使开麦不会影响游戏声音的品质;另一方面,语音还能与其他音乐音效共同听从游戏设计的指挥,一同为玩家的沉浸体验服务。
在这个方案里面……人声构成游戏事件的一部分。
2023 年北美 GDC 游戏开发者大会上
Audiokinetic(Wwise)公司展台上
向无数开发者呈现 GME for Wwise 方案
总结这个全新的语音方案,GME for Wwise 最大特点就是将边缘化的语音系统纳入游戏音频,鼓励音频设计师将语音作 为设计的一部分,让语音不停留于通话功能,而是能成为玩家与游戏交互的方式之一。
借助 Wwise 与 GME 的合作契机,语音模块逐步消解了边缘性,正慢慢从一个需要三方提供的解决方案,变成了能够拓展游戏厂商设计纬度的 ” 游戏声音 “。这也是我在了解新语音系统时感知最为明显的部分。
目前,越来越多的厂商开始引入 GME for Wwise 的语音功能,国内多款大热的 MOBA、派对产品,也已开始尝试接入该方案,以提升产品的语音体验。
03 亟待探索的新领域
语音对于游戏设计来说并非一个陌生领域。
此前,《In Verbis Virtus》《会说话的汤姆猫》等产品就尝试做了语音设计,玩家喊出特定内容,游戏对玩家做出一些回应。这些设计已经将语音视作了玩家与游戏交互的一种方式。
而 GME 与 Wwise 推出的独有解决方案,让语音真正在设计领域突围道路——它更接近于一次聚焦语音的技术变革,语音正追上游戏设计的其他模块,成为一块可用的组件,可以被更多团队在立项阶段视作实现差异化的武器之一。
根据一位音频设计师的进一步解释,游戏设计强调关联性,比如在声音范畴,单个声音可能并不出彩,但它们可以彼此配合,组成一块足够完整的体验,它们就能带来沉浸感。语音从新技术处获得的,正是它与其他组件的关联。
另一方面,GME for Wwise 也对团队带来了影响:如今一个语音模块,可以由客户端负责逻辑开发,音频部门来做创意设计;它提升效率的同时,也额外增加了创意发挥的部分。
探索还尚未普及开来。GME 在 Wwise 的第一个语音插件在 2020 年 1 月发布,随着一两轮开发周期过去,这一插件开始被更多开发者应用起来。而且许多产品仍在开发当中,对全新语音方案的应用程度仍是未知数。
但我们已经可以在已有产品中看到了许多很有趣的尝试。
语音与空间的关系就是一个方向。在 Wwise 介绍 GME 插件的 demo 里,他们就主要展示了语音在空间中折射、衰减的 3D 效果。站在研发角度,这一变化也变相影响着团队设计关卡结构的思路——《Suspects》便是如此。
传统太空杀的对局不需要语音,玩家各自推进任务,直到发现凶案,大家再在投票环节再交流信息;而《Suspects》让玩家们在对局中也能互相交流,不过若彼此离得越远,或者有建筑物阻挡,声音就会衰减。
对比传统设计,《Suspects》的关卡也要更加立体复杂,它会考虑到玩家之间彼此交流的轻快,尝试制造更多死角,来阻挡或衰减语音信息的传播—— 游戏的每个关卡有需要乘坐电梯的复式解构,有大量隔开的小房间,以及有高低差的楼梯间……
也因此,” 太空杀 ” 的尔虞我诈能贯穿整个对局过程:如果你怀疑某人有嫌疑,害怕他加害你,大可到处乱跑大叫他的名字,尝试向附近的人留下讯息;如果你是完成犯罪的嫌疑人,可以在事发前就找到其他人,提前释放假消息。
逍遥散人在直播时看到有玩家靠近,
就到处大喊 “cheche 贴我!我死了就是 cheche!”
Suspects 还做了一个提示效果:
玩家语音声音大小和角色光圈挂钩
《Suspects》的音频设计师在 Wwise 座谈分享的时候特别提到,他们之所以能够跳出品类限制,做出不少有关语音交互的乐趣,就是在接触 GME for Wwise 后,觉得可以把这些功能用起来,做一些过去不会想到的玩法。
除此之外,语音与游戏设计的结合方式还有很多。例如与队伍划分结合,不同队伍玩家的语音可以被赋予不同的声音特效;例如与变化的天气结合,队友的语音会混杂更多的气象效果,如下雨、刮风等,增加游戏环境的真实度。
再比如,语音与角色状态结合。如果玩家受到了攻击,状态不好,那么他的声音就可以按角色血量或 debuff 增加一些表达痛苦的混音;如果他需要火力支援,可以让其他游戏音效小声一些,突出角色求助的关键信息。
回顾语音的过往是很有趣的事。最早,语音服务商们的策略都是做一站式,要集成足够多的功能,覆盖足够多的场景,为客户提供足够丰富的服务。但无论如何变换,它都是面向游戏厂商做迭代。
如今,语音面向产品,完成功能突破。语音不是去满足游戏厂商多么百人千面的需求,而是进到了生产链路,成为产品的一部分,正想办法直接为游戏带来增益价值——站在产业角度来看,这也将改变行业对这一细分领域的诸多认知。
根据 GME 透露,现在已经有越来越多的游戏工作室对该方案感兴趣,并开始让在研项目对接全新的语音解决方案。而 Wwise 也在与许多使用了新语音方案的团队联系,让他们分享更多设计经验。
或将在不久的未来,我们就能看到语音模块会对游戏设计带来更多有趣的改变。
常见问题FAQ
- 购买下载地址
- 345卡盟题上新啦!!