编者按:自OpenAI旗下生成式AI工具ChatGPT在2022年末正式推出后,GPT(Generic Pre-trained Transformer,生成预训练转换器)这一博学、好学且机敏的革命性深度学习模型,在令业界感到激动不已的同时,也暗自捏了一把冷汗。其背后代表的人工智能生成内容(AIGC)技术,也被不少人视作人工智能的“奇点”。
【资料图】
眼光放至国内,2023年年初以来,亦有多家企业高调宣布入局AIGC.长期聚焦游戏产业与前沿技术交叉领域的南财合规科技研究院数字娱乐课题组注意到,不少游戏企业正在试图向这一技术靠拢。在百度官宣将在3月推出的“文心一言”项目后,多家科技企业宣布将同步接入,而其中亦不乏游戏企业的身影。
拥有丰富研发经验、大量用户群体的游戏企业,在将AIGC技术融合进旗下产品的过程中有着天然的优势,而AIGC技术亦有可能帮助游戏企业提高游戏质量以及用户体验。但在实际应用过程中,存在着哪些技术方面的难题仍需攻克?游戏企业又将面临哪些合规问题的新挑战?而宣布入局的游戏厂商对于AIGC概念的态度,仅停留在讲故事、蹭热点阶段,还是切实存在落地的可能?
系列报道第二篇,我们将进一步观察AIGC目前具体在游戏生产流程以及运营中的运用,并探讨未来可能的应用场景以及AIGC融合于游戏的实际发展难点。
在ChatGPT横空出世引爆社交媒体的同一时间,人们在乐此不疲地试验其对话能力、找寻AIbug的同时,也在畅想着这一新兴技术将在哪些应用场景中革新生产生活方式。与此同时,ChatGPT背后的GPT模型亦在不断发展升级。3月15日凌晨,OpenAI 正式公布了多模态预训练大模型 GPT-4,在生成内容准确性、文字输入限制、识图等能力上得到了飞跃性提升。
而游戏这一载体作为人们日常接触虚拟世界最直接的场景,很快被视作ChatGPT进入产业的首选落点之一,进入到“概念股”候选名单。一时间,多家游戏公司争相宣布与引入人工智能的计划,创投圈、二级市场继元宇宙后久违地再次陷入技术狂热中。
在进一步梳理行业状况、同业内人士交流后,21世纪经济报道记者发现,游戏公司布局AIGC技术并非“一时兴起”。事实上,AIGC在游戏行业的发展已经历时多年,应用范围也已渗透游戏的制作和开发流程。
但在以GPT-4为首的AIGC技术快速发展的背景下,该项技术也将对游戏产业现有的生产结构带来变革,不仅可能影响到游戏公司内部分岗位的设置,也将改变独立游戏的创作生态。
另一方面,尽管业内已在畅想AIGC技术普及后能够如何提升产能、解放生产力,但高昂的成本、技术的可复用性不足、生成内容的原创性低,以及来自C端的玩家对于生成式AI技术产出的内容的接受度不可控等,都是游戏产业在深入推进这项技术发展的过程中不得不面临的问题。
蛰伏
事实上,看似在2022年末才正式崛起的AIGC技术,已在游戏行业蛰伏多年。在游戏厂商探索工业化开发管线的进程中,相关的AIGC技术亦在如影随形发展。
以美国游戏厂商Rockstar(以下简称“R星”)为例,在旗下游戏《侠盗猎车手5》和《荒野大镖客2》中的NPC交互、人物建模、环境渲染等方面均用到了AIGC技术进行辅助开发。而在2021年的游戏开发者大会(GDC)上,R星也透露了公司内部正在探索机器学习技术。虽然R星并未透露这项技术的具体应用场景,但外界猜测机器学习技术或将运用于还未发售的《侠盗列车手6》中。
3D资产方面,早在2009年,日本游戏开发商白金工作室(Platinum Games)开发的动作角色扮演类游戏《猎天使魔女》中,用到的记录游戏中主角贝优妮塔令人眼花撩乱的打击动作的技术——动作捕捉(MoCap),就是一项通过将真人演出转化为游戏内角色动作的常用AI技术。同样属于白金工作室开发的动作游戏《鬼泣》系列,也用到了相同的技术。
而在国内,近年来已有越来越多的游戏厂商走上了工业化之路,并已将AIGC技术接入了工作流。
如腾讯AI Lab便将AIGC技术应用于MOBA、FPS、棋牌等游戏品类中,相关技术目前在旗下《王者荣耀》《和平精英》《使命召唤手游》等游戏中已有实际应用,在智能NPC、智能游戏角色动作等方面实现了AI化。
网易伏羲实验室则在其官网中指出,已将AI技术应用于游戏资源生产,既包括在《逆水寒》《天谕》等MMORPG端游中的表情、语音、动作合成,也包括学习用户行为特征生成游戏内的社交关系、消费方向以及对战策略推荐。
上海“游戏四小龙”中的米哈游和莉莉丝在这波AIGC浪潮中虽然低调,但并未隐身。
早在2018年,米哈游就成立了“逆熵科技研究院”。据悉,米哈游成立该研究院的初衷即是推动游戏制作、运营相关的图形图像处理、动画编辑、数据分析等技术的进步,并在场景建模、纹理迁移、布料建模、布料动画、人脸捕捉、声音合成、动作风格迁移等方面进行研究。
而莉莉丝则与AI技术研发商启元世界达成合作,将行为控制、数值设计、用户个性化推荐等方面的工作纳入AI解决方案,目前在《万国觉醒》《三国志战略版》《Farlight 84》等游戏中已投入使用。
近日,也有多家游戏公司的员工向21世纪经济报道记者透露,目前公司最新的游戏产品的研发流程中,已开始利用Stable Diffusion等生成式AI工具进行图标、UI、艺术字体等游戏内基础美术要素的设计,仅需在系统中输入关键词或提供近似的图片,就可生成相应的美术资产。甚至在整个美术资产的生成流程中,AI投入占比高达80%,人工投入仅占20%,需要人工作业的部分仅是对AI生成的素材进行微调。
变革
AIGC技术的快速发展,也在推动游戏产业的内部革新。正如上文中提到,AIGC已大大简化了游戏公司内部的美术元素生成难度,某上市游戏公司资深员工杰森(化名)也告诉21记者,由于生成式AI在“文生图”、“图生图”技术的迅猛进步,部分头部游戏厂商已经在对视觉设计相关的岗位进行大面积的“优化”。
“在(AIGC技术)目前的发展阶段中,对于C端用户的影响远远比不上对B端开发者的影响。尤其是游戏的研发侧,AIGC带来的影响是巨大的,如果不跟紧这波趋势,就很容易在技术快速迭代的浪潮中被淘汰。”杰森直言,AIGC技术的快速发展对于游戏公司的直接利好之一,就是可以直接节约一大笔来自基础研发、美术的外包费用,但与此同时,公司内一些替代性强的工种被AIGC技术取代也仅仅是“时间问题”。
人工智能科技公司rct.AI CEO陈雨恒也向21记者指出,当“属于AI的时代”真正到来,游戏产业中任何美术岗位甚至任何技术栈的工程师都将面临巨大的挑战,往往留下来的是掌握更高级技术且拥有更多主观思维的人才。同时,他也大胆预测,若AIGC技术维持目前的发展速度,以上提及的工种将有可能在2至3年间被完全替代。
不过,AIGC技术是否能取代所有具备创造性的工种,仍是一个充满争议性的话题。创新数字营销公司R/GA亚太区首席技术策略副总裁Anthony Baker则在接受21记者采访时指出,生成式AI应该被利用于取代工作流程必须处理的所有重复性且琐碎的任务,如图片编辑、编程和测试等属于生产流程而非创意和设计流程的工作。“AIGC应该被用来改进生产流程、预测人类的需求,而非淘汰所有具备创造性的人才。”Anthony Baker表示。
AIGC技术精简了制作游戏的人力成本,但这并不意味着游戏行业中的机会将越来越少,游戏公司可以动用人数更精简的研发团队进行产品开发,也意味着开发者进行独立游戏开发的成本和难度也将进一步降低。
以模拟经营游戏《星露谷物语》为例,该款游戏中的所有内容,包括程序、绘图、编剧、作曲等工作,均由开发者Eric Barone独自一人完成。据其本人接受媒体采访时描述,在工作强度最高的一段时期内,他必须一周七天都在从事游戏开发工作,并保证每天工作10个小时以上。在没有团队协作的背景下,他花费了约四年半的时间独自完成了这款游戏的全部开发工作。
北京师范大学艺术与传媒学院数字媒体系教师、“游戏的人”档案馆馆长刘梦霏在接受21记者采访时指出,AIGC技术的成熟,可以让一部分有着成熟游戏制作思路的独立游戏开发者,通过更简单的技术路径以及在更短的时间内输出有“个人表达”的游戏作品,而不必依托非常庞大的团队。
这也意味着,以Eric Barone为例的独立游戏开发者群体,在AIGC技术的加持下,将有机会花费更少的精力以及时间成本开发出一款完成度较高的游戏作品。
AIGC技术也给了独立游戏创作者更多比肩游戏大厂的可能。“在过去,如果团队仅有3人左右的规模,走传统的游戏开发流程,能做出来的作品完成度将非常有限。但当AIGC技术作为‘得力助手’加入后,就会有更多创新甚至制造精品的可能,回过头来或许会撬动一些游戏大厂的地盘。”陈雨恒指出。
目前,越来越多的“小作坊”开始尝试将AIGC技术加入开发流程。一名坐标英国的独立游戏创作者火火(化名)告诉21记者,目前团队正在考虑用AIGC技术来确定游戏的立绘风格,这对他们这间成员不足十人的工作室而言,可以省下大量口头讨论的时间和寻求外部美术资源所需要的资金。“但AI作画的产出的图片中,透视和人体姿势还存在着一些问题,因此目前仍然处于摸索和测试阶段。”火火说。
挑战
虽然在游戏研发与运营端已存在广泛的实践案例,但多位业内人士仍在与记者交流时指出,AI距离从根本上革新游戏产品的生产逻辑还存在诸多难点有待解决。
首当其冲的问题在于成本。据陈雨恒介绍,AI公司前期发展投入巨大,在当前经济下行的整体背景下,服务商往往愿意以较低的价格为游戏公司提供服务,但本质上是在烧投资人的钱开拓市场。真要核算成本,AI公司的技术投入要远高于企业招聘基础美工、程序员的用人支出。
成本居高不下的原因之一在于AI模型的复用性不足。以角色控制(Character Control)这一基础研发环节为例,游戏基础模型是2D、3D或是2.5D,游戏类型是RPG或是SLG、FPS,使用游戏引擎的不同……上述种种因素共同构成了技术架构间的差异,且不论游戏厂商是否都愿意把虚拟空间完全开放给AI进行尝试、理解和集成,非标准化的结构数据和接口就足以构成AI难以“兼收并蓄”的高门槛。
因此,当AI模型试图集成多种乃至全部游戏类型时,往往面临训练成本巨大,成果互动性差等现实问题。陈雨恒表示,目前部分基础性工作在不同游戏制作中差异较小,因而可以使用较为统一的解决方案加以解决,但当AIGC试图参与更为深入的研发工作时,通用性方案就难以胜任了,企业往往需要定制化服务或自行研发专用AI。
另一难点在于AIGC原创性的先天不足。杰森表示,当AI缺乏学习材料,需要从零到一构建一个在现有素材中鲜有参照的虚拟世界,或是需要针对一个最新变化调整制作风格时,生成的结果往往也不尽如人意。作为AI成长的‘养料’,数据的质量至关重要,而高质量的数据需要进行清洗。
陈雨恒也指出,相较于ChatGPT一类自然语言处理工具,游戏制作AI所需数据的清理要更为困难,前者可以通过雇佣第三世界国家相对廉价的劳动力简单进行培训,即可进行文本标注工作,而后者则需要具备游戏研发技能、了解游戏背景与含义的开发者才能完成。
他进一步表示,以同样标准制作一个专门面向游戏研发的标准化模型,成本大概是OpenAI在GPT3.5上投入的好几倍。
除了研发端的落地障碍,作为游戏产品消费端终点的玩家能否接受更为深入的AIGC,似乎也要打上一个问号。刘梦霏指出,玩家对游戏互动形式的需求存在差异,作为一个更偏好深度叙事的受众,她相信AI可以提供大众化的消费级文本,但难以产出真正具有深度、精巧世界观和人物设定的内容。
问题的关键或许在于叙事控制权的归属。就目前游戏研发的流程而言,即便考虑到自由度较高的开放世界游戏,大部分产品的叙事主动还是受到编剧和策划强控制。
陈雨恒指出,这种方式的优点在于,玩家可以在一定边界内享受被精心安排好的体验流程,同时对边界外未被直接制作出的内容始终抱有探索欲,这对游戏产品维持吸引力至关重要。但AIGC的应用将使得叙事控制权部分甚至全部地由制作者转向玩家,失去边界的体验很可能导致玩家的长期游玩兴趣在短时间内流失。
“就目前的游玩习惯而言,可能很多玩家都对可以自由对话的游戏世界抱有期待,但真正接触后却很难适应。一个直接的案例是,当与游戏内NPC(非玩家角色)对话时,从游戏设计师的角度出发,这个问题的本质就是,到底给玩家的交互界面应该是一个对话框还是三个选项。”陈雨恒表示,这或许需要更为成熟的产品和更长的实践周期培养玩家逐渐接受。
(文章来源:21世纪经济报道)