26 6月 2023

差一步称霸 AI:历史进程中的扎克伯格

 


2016 年 1 月,Facebook 的创始人扎克伯格在自家平台上公布了一则重磅新闻:Facebook 秘密研发的围棋 AI 机器人即将取得突破。

由于围棋的棋路千变万化,机器从来没有在该领域战胜过人类顶级棋手。Facebook 的 AI 如果真能战胜人类,无疑是一个里程碑级的事件。

图片

这个项目的领头人是 Facebook 的首席科学家杨立昆(Yann Le Cun),也是人工智能领域公认的泰斗级人物。上世纪 80 年代,杨立昆在贝尔实验室的自适应系统研究部门任职期间,开发了大名鼎鼎的 “卷积神经网络”。

2012 年,多伦多大学的教授杰夫・辛顿(Geoffrey Hinton)凭借着卷积神经网络 AlexNet 在 ImageNet 大赛上一战成名,直接开启了深度学习的浪潮。一年后,杨立昆成为 Facebook 人工智能研究院的第一任主任,两人在 2018 年一起拿到了计算机科学领域的最高荣誉图灵奖。

辛顿(左)与杨立昆(右)

辛顿(左)与杨立昆(右)

杨立昆加入后,Facebook 的 AI 研究风驰电掣。扎克伯格 2016 年 1 月预告的 “围棋 AI”,很可能是 Facebook 在 AI 领域野心与成就的一次集中展示。

然而,命运却向扎克伯格和杨立昆开了一个戏谑的玩笑 —— 两个月后,谷歌 DeepMind 团队研发的 AlphaGo 横空出世,以 4-1 战胜韩国棋手李世石。AI 从实验室迅速蔓延到社会舆论场,Facebook 也许只差那么一点点,就能站上舞台中央。

7 年过去,伴随 ChatGPT 再次将 AI 推向前沿科技的潮头,谷歌、微软、英伟达甚至百度都在按部就班的推动着历史进程,Facebook 似乎成为了一个尴尬的旁观者。

2023 年 5 月,美国副总统哈里斯在白宫举办了一场 AI 主题的闭门会,谷歌、微软、OpenAI 和 Anthropic 四家公司的 CEO 受邀出席。吃瓜群众很快发现了盲点:扎克伯格去哪儿了?

图片

拜登也出席了会议

事后,有好事记者跑去采访了一位匿名官员,后者略显阴阳怪气的回应 [4]:“目前在该领域处于领先地位的公司,才会收到邀请”。

那么,Facebook 真的落后了吗?

2013:离未来一步之遥

AlphaGo 战胜李世石后,全球掀起了一股创业浪潮。仅中国大陆,一年便诞生了 528 家 AI 创业公司。这个过程中,最失意的莫过于 Facebook 和杨立昆,从杨立昆当时更新的 Facebook 动态来看,他对 Google 的先声夺人相当不甘心。

图片

实际上,Facebook 离 AlphaGo 的创造者 DeepMind 一度非常接近:直到 2013 年,DeepMind 还是一家位于伦敦、只有几个博士的草台班子,谷歌 CEO 拉里・佩奇在打飞的时,偶然间听到马斯克与一位投资人的闲聊,才知道有这么一号人。

然而,嗅觉敏锐的拉里・佩奇立刻带领谷歌高管飞往伦敦,在 DeepMind 演示了一段 AI 自动玩游戏的 Demo 后,谷歌当场决定收购。

不过,DeepMind 很快收到了一个更高的报价,来自 Facebook。

当时的 Facebook 还是如日中天的社交网络巨人,但扎克伯格却如坐针毡。面对 iPhone 的节节胜利,扎克伯格认为,面对汹涌而来的移动互联网,Facebook 还远远没有获得数字世界的主导权。

为了深度参与移动化浪潮,扎克伯格秘密立项了一个自研手机项目,这部手机曾非常接近上市,甚至富士康已经做出了工程样机,但最终被取消,坐拥十亿用户的扎克伯格始终充满焦虑:谁会打败 Facebook?

出于这种防御性的目的,扎克伯格为 Facebook 的未来十年勾勒了两条路线:

一条是 VR,2014 年,Facebook 爽快的掏出 20 亿美元,收购了连众筹订单都还没交付完的 Oculus。那会儿还没 “元宇宙” 这么时髦的称呼,但扎克伯格坚信这是 “下一代互联网”。

另一条是 AI,扎克伯格让下属整理了一份全球顶级 AI 研究者的名单,自己挨个打电话三顾茅庐,这才有了对 DeepMind 的竞购。

不过,由于一些收购后权限的问题,DeepMind 最终花落谷歌,随后,扎克伯格又找到了还在纽约大学教书的杨立昆。

为了将杨立昆纳入麾下,扎克伯格答应了他许多苛刻甚至任性的要求,比如 AI 实验室设立在纽约,实验室与产品团队完全划清界限,允许杨立昆继续在纽约大学任职,研究成果必须开源等等。

相比之下,如今呼风唤雨的微软才是当年落后的那个。不出意外,Facebook 实验室迅速声名鹊起,论文一篇接着一篇,成为了谷歌最难缠的对手。

图片

Facebook 早期的 AI 团队

2015 年,Facebook 成功将 GAN(生成对抗网络)从 “玩具” 改造成了 “工具”,推动了 AI 绘画的兴起。一年后,Facebook 又推出了 PyTorch。这是一个集合了大量代码与模型算法的超级仓库,能免除不少重复性工作。日后一众机构大炼 AI 时,都用到了它。

但 AlphaGo 在 2016 年的横空出世似乎是一个转折点,杨立昆的得意门生扎伦巴(Wojciech Zaremba)在不久后离职,和身在谷歌的好基友伊利亚(Ilya Sutskever)一起跳槽去了一家名叫 OpenAI 的小公司。

2017 年底,正在替 Facebook 撰写传记的记者史蒂文约见了杨立昆。面对采访,杨立昆对 Facebook 的工作依然给出了极高的评价,“马克(扎克伯格)经常说,我的任务是推动最先进技术、研究的发展。如果研究成果能对产品产生影响,那很好,但要有更大的梦想。”

但几个月后,杨立昆本人却从 AI 实验室的管理岗位卸任了。

2018:仰望星空的权利

在 2018 年之前,Facebook 的 AI 实验室主要负责学术研究,由另一个产品团队负责成果的转化,两者互不干涉。但 2018 年初,这种架构发生了巨大的变化。

杨立昆卸任后,Facebook 新入职了一位副总裁,负责同时管理 AI 实验室和产品团队。原本的 AI 实验室,如今将承担更多来自产品团队的需求。

毫无疑问,此举显然违背了扎克伯格对杨立昆的承诺,但前者正被更大的麻烦困扰。三个月后,小扎将坐在美国国会山的证人席上,面如死灰,被近 100 位议员用 600 多个问题持续轰炸 10 个小时。

弱小、可怜、无助

弱小、可怜、无助

当时,Facebook 陷入了非常严重的监管危机:假新闻、操纵选举、传播极端信息。为了解决这些问题,小扎一度雇佣了上万人的审核团队,但意外仍在发生。

2019 年,一位暴徒在 Facebook 上直播了 17 分钟的无差别袭击,51 人在 200 多名直播观众面前失去了生命。

直播结束 12 分钟后,Facebook 才撤下了相关内容。随后,外包的内容审核公司决定不再与 Facebook 合作,因为平台上的极端信息 “对审核员造成了严重的心理创伤”。

走投无路之下,小扎选择将希望寄托于 AI,推动 AI 研究部门 “下沉到业务”。

这一时期,Facebook 加大了对识别型 AI 的投入,希望机器能筛选出霸凌、种族歧视的信息,甚至假新闻。

2021 年底,Facebook 社交媒体业务进一步失速,市场份额被 TikTok 大面积蚕食。在这种情况下,扎克伯格希望迅速启动新的现金流业务,改善公司的营收状况。在竞争压力下,Facebook 把赌注押在了尚不成熟的 VR 业务上,还将公司名字改成了 Meta。

改名一个月后,AI 研究团队又被划归到元宇宙部门,辅助 VR/AR 相关软件工具的开发,“为业务赋能”。

图片

Meta 曾试着做了一个生成 “元宇宙内容” 的 AI 工具

Meta 的 AI 业务之所以一路坎坎坷坷, 问题就出在社交媒体这门生意上。

和做 Windows 系统、云计算等基础设施生意的微软相比,社交媒体实在 “吃力不讨好”。面对平台治理难题,收购不完的竞争对手,Meta 开始疲于奔命。

面对激烈的竞争,Meta 的算力大多都被用在了广告、信息流,以及对标 TikTok 的短视频产品 Reels 上,留给研究团队的并不多。

在 2021 年,库克治下的苹果推出了 ATT(App Tracking Transparency)功能 —— 当 App 试图收集个人数据时,手机会有提示,用户有权拒绝。这对 Meta 赖以经营的定向广告是釜底抽薪的重拳。

核心的社交媒体业务腹背受敌,势必会影响 AI 研究部门的预算与学术宽容度。而在 2021 年后,Meta 又以 all in 的姿态投入 VR 产品,在全年亏损百亿美元的背景下,扎克伯格还打算加大力度,宣布 2023 年的元宇宙研发投入将提升至 390 亿美元,听得股东血压飙升。

2023 年 5 月,杨立昆在一档播客中提及了 Meta 落后的另一个原因:舆论压力。

社交媒体平台所获取的影响力,会让平台面临舆论的过分关注,几乎没有什么试错空间。更何况在 2018 年听证会之后,批评 Facebook 几乎成为了一种政治正确。

实际上,早在 ChatGPT 诞生之前,Meta 的 AI 团队就推出了聊天机器人 BlenderBot 3。后来有人跑去问 BlenderBot 3,该如何评价小扎与 Facebook,没想到 AI 回复称,“扎克伯格的商业行为并不总是合乎道德”“自从删除 facebook 后,我的生活好太多了”。

BlenderBot 3 的对话内容,是向公开的互联网文本学习来的 —— 瞧,没人喜欢扎克伯格。

图片

Meta 自家 AI 对扎克伯格的锐评

2023:出乎意料的对手

时间迈入到 GPT 时代,谷歌、微软与 OpenAI 承包了新闻的头版;相反,与 Meta 相关的新闻却似乎只剩下了裁员。从这个角度看来,白宫开会没请扎克伯格,也有几分道理。

但说 Meta 在 AI 领域毫无建树,显然也不客观。据科技风投机构 Thundermark Capital 的测算,直到 2022 年 Meta 的 “AI 研究指数” 依旧能在全球企业中位居第三,仅次于谷歌和微软。“AI 教父” 杨立昆从管理岗卸任后,仍在 Meta AI 担任首席科学家,能够在 Meta 继续搞研究。

主营业务虽陷入泥潭,但扎克伯格始终没有下牌桌。2023 年发生的两个 “意外”,更预示着 Meta 似乎将卷土重来。

第一个意外发生在 3 月,Meta 推出了用于 AR 研究的视觉大模型 SAM(Segment Anything)。SAM 是一个图像分割 AI,它能自动将图像中的每一个要素都识别并分割出来。

举个例子,如果让 SAM 看一张游客照,它能自动分割出画面中的景点、人物,以及人物穿的衣服、背的包、手中的饮料等每一个细节要素。

原本为 AR 而研发的 SAM,意外在 CV(计算机视觉)领域引起了轰动,“CV 版 ChatGPT” 的叫法不胫而走。包括宇视科技在内的大型安防企业,都受到 SAM 的启发,转而也去开发视觉大模型产品。

第二个意外发生在 5 月,媒体曝光了一位谷歌工程师的备忘录,标题为:“我们(谷歌)没有护城河,OpenAI 也一样”。

备忘录的主要内容,都在讲述一个名叫 LLaMA(美洲鸵)的大模型给他带来的冲击 ——LLaMA 是 Meta 在 2 月推出的一个大语言模型。简单来说,这只 “美洲驼” 与 ChatGPT 有三点不同:

其一,LLaMA 只是个基础模型,并没法直接拿去给 C 端用户使用。但开发人员能够以它为基础,去开发自己的聊天机器人;

其二,GPT 系列多为闭源,但 LLaMA 却向特定的合作伙伴开源其代码;

其三,GPT 系列追求 “大力出奇迹”,猛堆各种参数,但 LLaMA 讲究效率。其论文中提到,LLaMA 的上限虽不及 GPT-4,但 LLaMA 只需要 7B 参数,就能实现比 175B 参数的 GPT-3 更强的能力。

LLaMA 后来的轰动源于一次泄密 —— 有人将 LLaMA 的源代码公开到了 4chan 论坛上,使得任何一个普通工程师,都有机会开发自己的聊天机器人产品。毕竟最低档 7B 参数的 “美洲驼”,只需要一台笔记本电脑就能部署,不必像 OpenAI 那样动辄上万块 GPU,对中小开发者极其友好,且性能也没差到哪去。

泄漏后的几个月内,一位斯坦福大学的研究人员,只花了不到 600 美元就做出了一个性能尚可的 AI 聊天机器人;大洋彼岸的哈工大,数位研究人员用 “美洲驼” 和专业数据做出了一个医学知识 AI,取名叫 “华驼”。

围绕 LLaMA,一个生态开始涌现。

图片

在那位谷歌工程师看来,开源生态会让全世界的机构和个人研究员都参与进来,帮助美洲驼模型快速迭代和进化,封闭的谷歌、OpenAI 将输掉这场游戏。

上述观点虽没能得到所有人的认同,但开源的确是 Meta 所擅长的。尽管面临业务上的诸多麻烦,但 Meta 一直遵循当初对杨立昆的开源承诺,前文提到 PyTorch 框架正是其成果之一。

随后,媒体一反常态,将扎克伯格形容为 “AI 所需要的英雄”,因为他让 LLM(大语言模型)不再只被个别机构所垄断。据外媒爆料,新一代 “美洲驼” 已箭在弦上,准备正式向谷歌、微软发起冲锋。

对于 Meta,OpenAI 总裁阿尔特曼曾给出过一个非常贴切的评价:“我认为 Meta 的 AI 策略,在最风光的那几年也是相当混乱的。但我认为他们如今非常认真,并且有非常能干的人,预计 Meta 很快就会有更连贯的策略,并成为一个令人惊讶的新玩家。”

尾声

杨立昆在上世纪 80 年代就创造了卷积神经网络,但由于算力的匮乏,深度学习经历了漫长的冬天,直到 2012 年才开始提速。但踩下油门的人并不是杨立昆,而是他多年的好友杰夫・辛顿。

从某种角度看,杨立昆的经历和 Facebook 是类似的。

在互联网公司围绕着 DAU 和 GMV 短兵相接的年代,Facebook 就意识到了 AI 的潜力,并且和谷歌、亚马逊一样,做好了长期投入的准备。但伴随主营业务开始四面漏风,以 AI 和 VR 为代表的长远投资不可避免的产生动作变形。

在以亿为单位的 AI 军备竞赛里,Facebook 虽贵为 FAANG 的首字母,但盈利能力其实长期处于末流。

而在主营业务持续失血、AI 技术路线尚不明确的情况下,最初那些的义无反顾,也许多少会打点折扣。逐渐放缓的增长,也难以支撑扎克伯格继续四处下注。

图片

但另一方面,即便面临商业层面的种种困境,Meta 还是保持了为 AI 研究提供资金支持的策略,也最大程度遵守了对 AI 研究团队的承诺。坦率地说,足以令一些稍有风吹草动就关掉研究部门的国内公司汗颜。

对一家公司而言,“长期主义” 是一个昂贵的体系,它的核心其实是健康的收入结构、长期稳定的现金流。对一个企业掌舵者来说,“不下牌桌” 则更考验面临技术创新不确定性时,孤注一掷的魄力。

“长期主义” 其实是属于少数公司的特权,但 “不下牌桌” 有时却更加珍贵。

来源:远川研究所 微信号:YuanChuanInstitution

沒有留言: