通向AGI,阿里手中有几张牌?

2024-09-24 12:07
摘要:“AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。”9月19日,2024年云栖大会开幕式上,这位阿里最早的程序员,一向内敛的吴泳铭时不时地扶几下眼镜,给出了稍显大胆的趋势判断。对站在舞台中心的他..

“AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。”

9月19日,2024年云栖大会开幕式上,这位阿里最早的程序员,一向内敛的吴泳铭时不时地扶几下眼镜,给出了稍显大胆的趋势判断。

对站在舞台中心的他而言,大会有三个重要的时间节点叠加:底座模型通义千问通过备案刚过一周年;发布“用户为先,AI驱动”战略刚满一周年;阿里云“AI驱动,公共云优先”战略也将迎来一周年。

图源备注:图片由AI生成,图片授权服务商Midjourney

因此,这届云栖大会意义非凡。从主题演讲到展览设置,被AI“腌入味”的会场似乎已经隐隐暗示了他接下来的发言主题。核心的任务有两个,审视战略落实情况,总结成绩以及展望未来。

以“AI驱动”的阿里形成了“AI+云”匹配的商业模式,并看到了AI驱动的新增长。此外,AI改造了核心电商(淘天)、出海(AIDC)、企业办公(钉钉)等诸多现有业务场景,赋予的未来潜力正在逐步显现。

对AI情有独钟,回到舒适领域的吴泳铭也从技术角度给出了自己的预判。他认为AI的最大想象力是逐渐渗透数字世界,并接管数字世界,物理世界的大部分事物都会具备AI能力,形成下一代的全新产品,并与云端AI驱动的数字世界连接产生协同效应。

一年的时间,阿里这艘大船找到了航道。

技术和市场的车轮仍在滚滚向前,AI新贵在资本红海厮杀,“老钱”大厂抢占生态位,积极求变。当GPT-o1发出了技术新范式宣言,阿里将驶向怎样的AGI未来?

转向:从数据到大模型能力

上一个时代的巨头相继转向,根本在于“已经变了天”。

互联网时期信奉“数据至上”,依托社交、电商、搜索、娱乐等不同场景,各类互联网企业完成了发展的第一阶段。

但生成式AI打破了以数据为驱动的传统逻辑,不再仅仅依赖已有的数据进行学习和决策,而是通过深度学习算法和大规模的计算能力,自主地生成新的内容和解决方案。随着技术曲线的成熟,大模型的泛化能力会越来越强,最理想情况下,通用大模型可以解决所有问题。如此一来,基础大模型所衍生的一些应用与能力,将成为该阶段最核心的竞争力。

大模型与云计算是AI2.0时代的一对“蜜侣”,其羁绊可以从IaaS、PaaS、SaaS算到如今的MaaS(Model as a Service),模型即服务。背后还有一条暗线,从信息化到数字化再到智能化。云计算+大模型自然地承接了从数字化转型智能化的用户和他们“落后就要挨打”的恐惧。

MaaS概念诞生意味着亦可以像SaaS一般提供独立的工具和产品,一旦产生规模化效应,便可以实现标准化盈利,这也是阿里认为“AI+云”商业模式可行的原因所在。这客观上让AI把云又做“厚”了一层,为之带来新的附加价值。

数据表明,阿里的“AI+云”战略已现在云上崭露成效。2024年第二季度,阿里云公共云收入双位数增长,AI相关产品收入三位数增长,阿里云季度经调整EBITA同比增长155%,使用阿里云AI平台(百炼)的付费用户数量环比增长超过200%。

大模型到来后,分化出两类产品,AI原生与AI+,前者代表是各类Chat Bot,后者典型是现有业务AI化改造。AI公司集中攻克的AI助手目前只能算个“半成品”,用户市场仍需拓荒。相较之下,AI加持下的现有业务更容易看到“疗效”。具体表现形式,包括toB和toC两种形态。短期内,与“降本增效”和“生产力”直接挂钩的2B业务需求更强,也能更迅速地切入到企业场景中。

钉钉的AI化改造就经历了全场景AI集成的“+AI”阶段,加之利用AI点满技能点,更容易为客户创造生产力阶段。截至目前,钉钉拥有AI生态伙伴超100万,AI智能体超50万,AI日调用量超1000万次。

Agent或许是激活中国SaaS和办公市场的重要因素,以结果为导向,未来服务本质是售卖服务,而不是售卖软件。“软件+AI+协作生产”视角下诞生的是千千万万的企业数字员工,创造的是“滚雪球”般的生产力价值。

ToC色彩偏重一点的“AI+电商”因为体量大、业务复杂,价值释放更为长尾。考虑到阿里和腾讯此前,先后打通了信息流(微信广告跳转淘宝天猫)与资金流(淘天接入微信支付),可能掩盖了短期AI为电商带来的增量。

事实上,“AI+电商”价值释放有三重逻辑:第一个阶段是由AGI推动营销创意辅助,具体表现为降本增效。第二个阶段是售后与复购,该阶段的重心是存量价值发现,这包括智能客服、物流配送、用户运营。第三个阶段是AI电商真正的价值增量所在,表现为智能营销,包括智能投流、AI经营等。

值得一提的是AI驱动的全平台投放产品“全站推广”,8月淘天已全量上线该产品,释放业绩的周期在6-12个月。

阿里的决心

去年,国内的百模大战就已经进入白热化阶段。

截至2023年7月底,国内累计有130个大模型问世,仅前7个月就有64个大模型发布。“AI六虎”相继获得融资,估值飞涨,势头强劲。种种迹象都表明,一个崭新的时代即将开启。

一如国际同业微软、谷歌、亚马逊,阿里也需回答“要不要押注生成式AI”的历史性问题。该问题对阿里尤为重要。

对阿里来说,探索AI的发展路径有三个:作为技术的探路者,探索机器智能实现AGI的潜力;作为开源模型和领先云计算服务的提供者,积极投资大模型发展云计算业务;拥有最广泛应用场景的核心业务,都能通过AI驱动。

阿里似乎不愿错过哪怕一次机会。有知情人士表示,“吴妈”对于新技术的嗅觉和魄力非常强,元璟资本“经常在还没有东西的时候就敢下手,从而占得市场先机”。

大模型喷涌爆发以来,存在几类选手:补课、弯道超车和黑马新贵。这直接导致了几种典型提供产品的模式,如通过云提供MaaS服务,提供闭源大模型产品以及提供开源大模型产品。能同时具备以上几种,国外有谷歌,国内目前仅有阿里——核心原因在于其云的技术优势。

正是因为云的关系,让阿里从一开始就成为唯一一家开源、自研两条腿走路的公司。吴泳铭曾在业绩电话会上解释,“开源模型会在开发者广泛使用上占据优势,这将匹配提供AI基础设施阿里云的商业模式,因为当更多开发者使用时,在其应用上线时也会优先选择阿里云的AI产品。”

阿里在探索大模型落地过程中,形成“AI+云”的商业模式,有其不可复制性。

很多开发者和创业团队对通义开源大模型Qwen的评价是“良心”,在模型能力、尺寸、开放权重上真正做到了可用,越来越多人用Qwen取代Llama系列模型。

据悉,新一代开源旗舰模型Qwen2.5-72B性能超越Llama3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型Qwen-Max全方位升级,性能已经逼近GPT-4o。通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。

过去一年,大模型技术也实现了多个里程碑式跨越。去年4月,阿里云发布首个大语言模型通义千问,如今通义大模型家族已全面涵盖语言、图像、视频、音频等全模态,储备了完整的技术发展体系。

目前卡大模型脖子的主要因素有两个:算力和推理成本。受益于“AI+云”一体化战略,阿里云在市场上的价格颇具竞争力,云和模型使用成本双双下降,规模效应也更大。

5月,阿里一手主导了大模型行业的大降价,通义千问GPT-4级主力模型Qwen-Long API价格直降97%。云栖大会,阿里云宣布通义千问三款主力模型再次大幅降价,最高降幅85%。

截至目前为止,全球大模型都没有形成闭环的商业模式,最为清晰且确定的还是云和广告,恰好这两张牌都握在阿里手中。押注新晋AI公司更像是大厂的“投石问路”,关键还是要观察新技术如何与业务、生态发生化学反应。

阿里的AGI筹码

和绝大部分科技公司一样,阿里也将目标瞄准了AGI通用人工智能,“声音、文本、图片和视频,都通过同一套体系糅合在一起的终极大模型”。

AGI如同彼岸摇曳盛开的花朵,艳丽的颜色吸引着河对面的人前仆后继,其中的水势湍急和曲折只有摸索方才知晓。

技术狂飙22个月后,大模型整体进入了暂时性的收敛阶段。

从技术上看,OpenAI改变范式开辟全新模型GPTo系列,试图寻求后训练阶段的Scaling Law,从侧面说明了预训练和数据陷入了瓶颈期。OpenAI的“牛刀小试”,给了行业新的技术方向,但也面临试错的风险。在早期阶段,谁也无法预言究竟哪条路通向AGI。

按照OpenAI的路径,大模型进场门槛再次被拉高,几乎不可能再有新玩家进入。而达到GPT-4o水平的公司将能先一步拿到下半场的入场券,留在牌桌上能搏一搏的玩家,大概率还要继续加码看牌。

阿里已经预订下了入场门票,并试图扩大赢面。阿里、腾讯投遍了国内AI六虎,放眼国外,Inflection AI卖身微软,Character.AI投靠谷歌。大模型是“吞金兽”,短期内赚钱困难,又挥金如土。AI公司现在勉强靠资本过活,不如大厂们主动“造血”。截至目前,阿里的AI商业化路线已经浮出水面,即“云+AI”到“AI+toB”再到“AI+电商”。AI基建设施和基础模型过硬后,需要做的是应用层面循序铺开。

但行业也有下一步发展需要面对的问题。

ChatGPT的横空出世,让人们对AI助手的形态有了“先入为主”的认知。关于这个问题有待商榷,是否有必要把所有的操作过程都留在一个“框”内。对大部分公司来说,拥有的是语音能力、视频能力、视觉能力、文字对话等原子能力,如何落地和排列组合比拘泥于形态更有意义。

还有AI与具体业务的融合,行业“+AI”的改造基本完成。大厂原来的优势仍是AI时代的优势,这一点未曾改变,但深入的融合尚在早期,还远远不够。

我们最近观察到的动态是端与端之间的融合在加深,譬如夸克借助AI搜索进一步打通了PC端和手机端。诸如“AI+电商”这类渗透在分发、消费和生态的业务,还有很大空间去进行深度融合和AI化改造。

种种未知,也代表着无限种可能,或许才是吴泳铭在云栖大会上,言辞坚定、大胆预判的原因。

更新于:1个月前