文丨贺乾明
编辑丨黄俊杰
去年 10 月的一个下午,游戏原画师刘渡(化名)正在修图,一位游戏策划来到他邻座,指着同事的屏幕说:“这是 AI 出的图,你修一下我们就用了。”
他看到屏幕上有三张游戏场景图,画风写实,和公司常用的风格不太搭,但细节足够丰富。隔壁同事用 Photoshop 给三幅图加滤镜变成卡通风格,不用一个下午就改完发给了策划。
刘渡意识到,他设想的职业成长路径走不通了。他刚毕业一年多,计划在这间主做出海市场的中等规模游戏公司好好磨炼手绘技巧,再跳去更大的平台。
“拼了命地去学手绘也很难走下去了。” 刘渡自己画一张类似的图,从构思到画,再到打磨细节,需要三天。
一个月后,ChatGPT 发布,很快引起全世界对 AI 替代人类创造性工作的担忧。单个作品制作周期普遍超过一年、需要公司内外上百人绘制至少几千张图的游戏行业对此格外上心。
从游戏外包公司负责人,到不同规模游戏公司的美术制作人员和团队负责人,我们采访的十几位从业者都在过去半年里对 AI 制作水平感到震撼。
震撼之后是焦虑。焦虑之后,其中一些人感受到的是,兴奋和满足。
半年后,刘渡已经不在游戏公司工作。他主动离职加入一家文旅创意公司,成了一个 “单人创意团队”,平均每天用 Midjourney 生成上百张图,选出其中几张,修改后用在公司的营销海报里。
刘渡主要靠自学。他最早从淘宝上花 30 多元买教程,后来跟着 B 站 UP 主的视频试验,尽可能跟上技术更新的进度。最近他建了一个 “AI 绘画交流分享” 群,和感兴趣的朋友一起关注最新进展。
新工作更轻松,但收入更高了。刘渡说是因为学了 AI 才拿到这份工作。现在他又重新找到了绘画的乐趣,不用 AI、不为工作,画自己想画的东西。
腾讯游戏、网易游戏已经在内部推广 AI 作图工具。大量游戏公司把人工智能生成的图片、文字放到游戏和宣传海报中。
上海一家游戏公司美术人士说,公司不鼓励员工用 AI 作图工具,因为 “米其林三星厨师做菜不放味精”。他还是看到许多同事悄悄用相关工具,让工作更快一点。
重人力的外包行业受冲击最大。成都一家游戏美术外包公司负责人已经在最近两个月丢掉多个客户,都是因为客户公司自己开始用 AI 作图。他已经跟几位相熟的老员工建议,早为将来做打算。
就像每一次生产力革命的到来,一些人失去工作、一些人会得到发展机会。最终,更擅长用新工具的人抢走工作。
半年时间,人工智能在游戏业从玩具变成了工具
去年 10 月,心动公司 CEO 黄一孟就在社交媒体上说 AI 作画很火,“是时候给自己找个理由,重新配一台 4090 (显卡)的电脑了”。
心动公司一边投资制作游戏、一边运营手机游戏分发平台,年收入 34 亿元。从大学时和同学戴云杰联合创办资源分享社区 VeryCD 算起,黄一孟已经创业 20 年。他一直热衷于亲自体验最新的科技产品和游戏。
不过新电脑送到家之后,黄一孟主要还是用来玩游戏,“当时完全没想到 AI 作画的影响力这么大”。
制作一款现代游戏工程浩大,主要步骤都需要美术团队参与:
概念和策划:根据游戏策划的前期讨论,制作概念图,让整个团队的美术、策划、开发成员直观感受游戏的氛围、目标受众等。
原画:画出游戏中的主要角色、场景,和模型、开发等各方确认是否可以在游戏中实现。
生产阶段:根据原画制作所有角色、场景不同视角的精细图片,然后交给模型团队做成 3D 模型,变成游戏里的角色和物体。游戏里的每个道具、技能图标也都要美术团队绘制 —— 复杂的 RPG 游戏里会有上千个。
“这是一个人力密集型行业。” 一位曾在国际 3A 游戏公司负责图像的人士说。他当时所在的游戏制作核心团队大概 40 人,只有 3 人负责美术。但这 3 人背后有一个庞大的美术制作体系:团队所在地有 150 人的美术中台团队为他们服务;在上海有公司的内包美术团队,给这 150 人服务;在中国其他城市,比如南京、成都,还有团队为上海的内包团队工作。多位游戏行业人士估算,现在开发一款游戏的成本,50% 用在美术上。
半年多之前,AI 作图应用无法精确控制生成图片的风格或内容。AI 工具能做的只是在第一个阶段生成概念图。这是游戏制作过程里美术团队投入最少的一个工作。“其实去网上找图也不慢,只是让大家有个感觉。” 一位游戏美术中台负责人对《晚点 LatePost》说。
刘渡所在游戏公司能先用上 AI 工具作图,主要原因是他们当时没开发新游戏,美术工作主要画概念图和营销用的图。最耗费精力的生产环节还无法用 AI 加速。
许多游戏公司人士的想法跟黄一孟类似,那时并不认为 AI 会大幅提高生产力。在一次业内活动上,还有腾讯游戏团队的人说 “外包就是我们的人工智能”。
到 2022 年底,当全球关注 ChatGPT 的时候,AI 作图应用也有了重大突破。一位韩国科学技术院的开发者把 LoRA 用到了 Stable Diffusion 中。开发者只需要上传几十张相同风格的图片进 Stable Diffusion,就能训练一个专门生成同种风格图片的模型。
LoRA 最早由微软发明,用于低成本微调大语言模型,它让 AI 作图变得可控且便宜。基于 Stable Diffusion 训练一个 LoRA 作图模型,一台配备英伟达 4090 游戏显卡的电脑一晚上就能完成。
基于 LoRA 微调模型生成的图,左侧为手绘图,右侧为 AI 生成的图片。来源:游戏动画师大谷 Spitzer
两个月后,斯坦福大学的博士生 Lvmin Zhang 开发了 Stable Diffusion 插件 ControlNet,让人可以精确指挥 AI 模型生成图片细节。比如使用者可以要求 AI 将白猫变成黑猫,整个过程不会改变猫的样子;也可以要求 AI 按照手绘的线稿上色。
用 ControlNet 控制模型给手绘线稿上色。来源:ControlNet 的 GitHub 页面
从人指挥人,到人指挥 AI
在心动美术中台团队办公区,许多人工位上都有两个屏幕,一个显示游戏画面,另一个显示代码。经过几个月的摸索,心动逐渐尝试把 Stable Diffusion 嵌入到游戏生产过程里。
概念图以外,目前最成熟的工序是画图标。图标是游戏中表示道具、技能、功能等要素的图片,是最常见的美术资产。
“好的图标能提升游戏质感,它也是非常消耗资源的部分。” 心动美术中台负责人曾子锋说。如果要求制作精良,每个图标至少需要一位画师画一天。现在用人工智能辅助,心动制作图标的效率提升将近 4 倍。
美术不用再照着原型图一遍一遍上色,修改细节,耗费大量时间。画师可以先画十几张完整的图,用 LoRA 调整 Stable Diffusion,训练一个风格确定的模型。然后,他们只要画好草图,输入到模型中,用 ControlNet 控制生成细节,然后给模型生成的图提修改建议,让模型继续生成,最后再由自己定稿。
曾子锋 2000 年开始学习用计算机绘画,毕业后先做了用户体验设计,后来进入游戏行业,经历过多次技术革新对商业绘画和设计的冲击。
今年新年后,曾子锋给一款游戏的美术团队负责人介绍人工智能。他让对方先画个背包图标的草图、指定想要的风格,输进调整好的 Stable Diffusion 。不到一分钟时间,屏幕上出现了 50 个风格相同但不重样的背包图标,“如果不满意,再点一下就能再有 50 个”。他看到对方脸上无法抑制的激动表情。这位负责人在 5 分钟内就决定采用新技术,解决积压的工作。
图标的绘制之前大多由外包团队完成。曾子锋在确定人工智能工具可以提高效率后,就暂停了部分美术外包,“我们需要先了解研究 AI 技术会给美术流程带来多大的变化”。他打算先内部摸清楚 AI 对制作效率提升多少,再和外包团队商量新的生产节奏和成本。
一同停掉外包还有心动的游戏翻译团队,替代者是 ChatGPT。“原本内部也有人负责后续审核和润色。(外包)换成 AI,怎么着都提升效率。” 黄一孟说。ChatGPT 还能根据设定给游戏中的场景、角色、技能取名字、写描述,“策划肯定都用得上”。
技术实力更领先的育碧,则是开发了一个类似 ChatGPT 的文本生成工具 Ghostwriter(影子写手),辅助游戏开发者写游戏角色的次要对话。根据育碧的演示,开发者往 Ghostwriter 里输入背景信息,应用会生成几条文字,让开发者选择更合适的那一条 —— 这个选择的过程就是人对 AI 作出反馈,可以提升模型的能力。
在高度分工的行业,通常是一些人指挥另一些人完成更初级的工作。AI 的介入基本不会完全替代一个工种,但初级工作需要的人力大大减少。
游戏的分发和推荐也需要 AI 大语言模型的介入。心动经营的 TapTap 是全球最大的手机游戏玩家社区,中国版每个月有超过 4000 万人使用。过去一年,靠着改进推荐算法等措施,TapTap 的收入增长超 40% 到近 10 亿元。
TapTap 算法团队负责人李昀泽是心动公司最早意识到 ChatGPT 潜力的人之一。他 2020 年离开阿里妈妈加入心动,带队重写了 TapTap 广告推荐算法。ChatGPT 发布不到一周,他就给公司的高管们做了一次技术分享,在那之后,他的大部分精力都在研究如何以 AI 提升 TapTap 的效率。
李昀泽现在最要紧任务,是带着团队汇总游戏相关的文本数据,用开源的大语言模型开发新的搜索功能,让用户在 TapTap 上更准确地找游戏、查攻略。
“游戏也是一个学习产品,一款游戏好不好玩,需要深度体验、掌握技巧后才能有明确感受”。李昀泽说,ChatGPT 类似的技术,可以降低用户学习一款游戏的门槛,让玩家受众变得更广,从而提升整个行业的效率。
昨天还绕不开的技术问题,今天可能就解决了
技术在快速迭代。此前半年,李昀泽和曾子锋有共同的感觉。
和黄一孟等公司高管确认要开发 TapTap 新功能后,李昀泽制定的方案是用开源的大语言模型,用心动积累的专有数据训练,“当时觉得调用 ChatGPT 的 API 太贵了”。
到了 3 月初,OpenAI 把 ChatGPT 的 API 价格压低到原来的十分之一,处理百万个单词还不到 20 元人民币。他制定的开源方案随之动摇,最大的价格问题已经解决,心动开始使用微软在中国代理的 ChatGPT 服务。
现在,心动的方案又回到了开源大模型上。从 Meta 开源 LLaMA 之后,开源社区每天都有大量的项目诞生,效果持续提升。虽然效果还有差距,开源社区已经具备了复刻一个 ChatGPT 的所有组件。
“最难的是学习过程,因为它进展得特别快。” 李昀泽说。他与几位大模型创业者建了个微信群讨论最新技术进展和论文,半天不看,未读消息就有 99+。
“CPU (脑子)已经很久没有全负荷运转了。” 曾子锋也说,“过去这几周,完全没停下来过,因为信息更新太快了”。
他现在与同事交流技术,都会事先强调 “今天说的话,不一定明天就会有用”。他有过切实体会。
今年 2 月,曾子锋刚把 “用人工智提升美术效率” 写进年度 OKR 没多久,就遇到瓶颈。LoRA 能控制模型生成图片的风格,但无法控制细节,很难用到实际美术生产环节。他和同事想尽各种办法 —— 试验不同的提示词,调整训练 LoRA 的方式,尽可能让模型再听话一些,效果都不够好。
然后 ControlNet 出现了。“之前绞尽脑汁想达到的效果和画面控制力,通过它很简单的就实现了。” 他说。
为了让团队成员更快地跟上技术迭代速度,心动美术中台部门每周五都会组织 AI 技术交流会,鼓励同事分享使用 AI 的技巧和新技术信息,公司也建了专门讨论 AI 的 Slack 频道。
心动组织 AI 交流会的场景。来源:心动公司
在 AI 作图工具和 ChatGPT 提高游戏资产制作效率前,AI 已经可以模仿配音演员,帮游戏公司提高游戏角色配音的效率,并在建 3D 模型、动画制作、测试等环节发挥作用。
现在,AI 带来的冲击远未结束。心动的员工正研究怎么用 AI 生成游戏角色不同角度的图片,找出一个更低成本制作 3D 模型的方式。这是现在 AI 作图工具的短板 —— 它可以理解文字、颜色,很难理解空间。
技术更强的公司已经加入进来。游戏引擎公司 Unity 放出的 AI 工具宣传片中,第一句话就是 “生成一个 3D 女性角色”。OpenAI 近期也发了一篇论文,研究 AI 怎么更好的生成 3D 资产。
今年 3 月举办的全球游戏开发者大会(GDC)上,AI 是最热门的话题 —— 从游戏环境素材、配音、NPC 脚本写作等一切人工智能可以参与的环节都有人讨论。每一场有关 AI 的讨论都座无虚席,还有数百人冒着大风、暴雨去参加 a16z 等机构赞助的 AI 活动。
市场调研机构 Omdia 游戏技术首席分析师利亚姆・迪恩(Liam Deane)逛完全球游戏开发者大会后的感受是,行业普遍认为 AI 会对游戏行业产生重大影响,但还没有几家公司做出来 ChatGPT 或 Stable Diffusion 等新技术驱动的产品。根据 Omdia 的数据,截至今年 3 月,只有 5% 的游戏技术供应商做出了新工具。这意味着未来会有巨大的发展空间。
开发一款产品将会更简单,但成就一个产品不会更容易
AI 技术会简化制作美术的过程,节省时间和金钱,降低开发游戏的门槛。但制作一款成功的游戏不会更容易。甚至制作一款游戏需要的人可能也不会变少。
1980 年代,乔布斯买下 Pixar,他认为随着计算机做制作 3D 画面能力变强,制作电影特效的成本会大大降低。他对了,也错了。
今天电影特效的制作成本大为降低,一些曾经无法想象的画面已经能实现。但大制作电影用了更多更真实的计算机特效。迪士尼 2019 年的《复仇者联盟 4》光计算机特效费用就超过 3.5 亿美元,超过 2000 年之前任何一部电影的总开支。
游戏也是类似。30 年前,游戏公司开发一款游戏,开发者得从头写所有代码,处理软件与各种底层硬件的交互细节。
30 年后,Unity、Unreal 等游戏引擎普及,把游戏的底层开发工作简化。现在游戏开发商想实现高难度的技术,比如 3D 场景实时渲染,靠各种各样的编程接口就可以完成。2020 年发售的《赛博朋克 2077》制作成本高达 1.74 亿美元、营销又花了 1.4 亿美元。在游戏引擎普及前,500 万美元做一个游戏已经算超大手笔。
如 Midjourney 创始人大卫・霍尔兹(David Holz)的总结,新技术出现后,有些人会试图削减成本,有些人会试图扩大业务规模。“想扩大业务规模的人,仍然会花同样多的成本。而那些试图削减成本的人,我认为会失败。”
北京一家中型游戏公司负责新品孵化业务的人士说,他负责的游戏团队用 Midjourney 辅助做原画已经半年多,现在给 Midjourney 招了一个初级的美术,主要负责修改图片。接下来,他打算花更多钱请一位更资深的美术。
他觉得高级美术在大量手绘训练中已经熟悉了不同的风格,能与人工智能配合,高效地处理各种风格的图像需求,“节省出来的时间,可以去做更有价值的事”。
招聘需求也变了。一位正在找工作的游戏原画师说,过去一个月他面试了四家公司,每一家的业务面试官都会问他 AI 相关的问题。成都外包公司老板的态度更坚决,“团队再进人,肯定倾向于会 AI 的”。
身处这个行业的大多数人,已经开始接受 AI 是游戏制作的未来。一位前腾讯游戏中台的美术人士说,“用 AI 提升效率,是躲不掉的。”
他们期望用 AI 无法替代的资深人士,指挥 AI 做更复杂更好的产品,在这一轮技术演进里抢得先机。
至于 AI 接手初级工作后,一位年轻画师怎么在毕业后找到工作机会锻炼技法、提升基本功,“从初级变成高级”,胜任更复杂的工作。这是一个目前还没人能回答的问题。
AI 将如何改造创造性工作,游戏行业已经给出模糊的前景。这次技术改造不会停在游戏业。
题图:计算机绘图软件出现前的作图场景。来源:Rare Historical Photos
来源:晚点 LatePost 微信号:postlate
沒有留言:
張貼留言