谁才是大模型“四小龙”?
这两年热闹的大模型创业潮,被业内称为“AI2.0”。
与之对应的“AI1.0”,指的是2015年左右开始的那一波AI创业潮,当时诞生了商汤、旷视、云从、依图等明星创业公司,它们以CV技术(计算机视觉)为主导,大量融资,风头无两。这四家公司,是公认的“AI四小龙”。
“AI2.0”时代,大语言模型成了新的主导技术,业界普遍认为,这一波浪潮会掀起生产力***。这次同样出现了很多创业公司,它们被投资机构和科技巨头追捧,估值水涨船高。但谁是“大模型四小龙”,目前尚无共识。
有一种说法是,智谱AI、月之暗面、百川智能、面壁智能,这四家公司是新的“四小龙”,在6月中旬举办的2024智源大会上,四位CEO首次同台,“四小龙”的说法就传开了。
还有人说中国有“大模型五虎”:百川智能、智谱AI、月之暗面、MiniMax、云从科技。这里边把面壁智能剔除了。
这些说法没有得到广泛认可。总体上,智谱AI、百川智能、月之暗面可以入围,剩下的这个名额会给谁,还存在不确定性。
我们认为,综合创始人背景、技术实力、融资能力、商业化潜力等因素,智谱AI、百川智能、月之暗面、MiniMax这四家公司,可以称作“大模型四小龙”,它们最有可能拿到“AI2.0”时代的船票。
四小龙,各不同
“大模型四小龙”,各有各的特色,我们分别用四个词来形容:根正苗红(智谱AI)、厚积薄发(百川智能)、高举高打(月之暗面)、隐秘机巧(MiniMax)。
从公司成立时间来看,智谱AI最早——2019年6月,那会儿大模型很小众,科技圈和投资圈没什么人关注。百川智能最晚——2023年4月,当时ChatGPT已经亮相快半年,国内大模型公司正在抢人、抢钱。
智谱AI来头不小,它由清华大学孵化,脱胎于清华大学计算机系知识工程实验室,是根正苗红的清华系。它的核心团队也来自清华,CEO张鹏是清华计算机系博士,总裁王绍兰为清华创新领军博士,首席科学家唐杰是清华计算机系教授。
清华的光环加持,再加上入局早,让智谱AI有一定先发优势。早在2020年,智谱AI就研发并训练了一个百亿参数的模型。OpenAI发布GPT-3模型后,智谱AI加大在预训练大模型上的投入,后来几乎全模型产品线对标OpenAI。
从整体的观感上,智谱AI对外展现的形象很正,讲的故事也很大,包括它背后的投资机构也主要是人民币背景。
最晚入局的百川智能,所有能量来自王小川。
王小川是互联网江湖里的“老人”,早年在搜狐一路做到CTO的位置,后来又在搜狐内部创业,担任搜狗CEO,最后搜狗被卖给了腾讯。王小川的技术实力和创业能力早已被验证,过去这些年他也积累了深厚的人脉,所以当他宣布入局大模型创业时引起了很高关注。
另外,王小川当年带领搜狗搜索跟百度搜索打仗,如今又在大模型赛道和百度狭路相逢,时不时吐槽几句李彦宏,这些素材成为人们茶余饭后的话题,也增加了百川智能的热度。
月之暗面比百川智能早成立一个月,没有显赫的背景,但有一个明星创始人。
杨植麟92年生人,是这几个大模型公司CEO中最年轻的,他毕业于清华大学和卡耐基梅隆大学,学术和工作经历都跟大语言模型相关,之前就在AI学术圈小有名气,算是个小天才式的人物。尤其是他读博士时,跟着苹果AI研究负责人和谷歌首席科学家做研究,发了一些论文,给了他很大加持。
这些标签和光环,被杨植麟充分利用,经过有意识的包装和营销,他树立了清华90后学霸的人设,被打造成新锐大模型创业者的代表。
这家公司的创始人和产品,都比公司有名。今年3月Kimi智能助手爆火出圈之前,很多人根本不知道月之暗面。但杨植麟一路高举高打,硬是靠一个人打满了全场。
MiniMax是这四家公司中最低调的,但实力不容小觑。它早在2021年12月就成立了,比目前市场上活跃的大部分大模型公司都要早,它在2022年推出的AI对话产品Glow,上线四个月就收获了近500万用户,在年轻人中很受欢迎。
当很多大模型公司在拼参数、秀肌肉的时候,MiniMax已经找到了应用场景,并将产品悄悄落地了,还打进了海外市场。
MiniMax的核心班底来自商汤,创始人闫俊杰在商汤从实习生做到副总裁,还曾担任研究院副院长和智慧城市事业群CTO,这项业务曾为商汤贡献了大量收入。在2021年底商汤上市前,闫俊杰离职创办了MiniMax。联合创始人周彧聪也曾在商汤科技研究院主管算法团队。
商汤就是在上一轮AI创业潮中成长起来的,位列“AI四小龙”,如今,闫俊杰创办的MiniMax晋级为“大模型四小龙”,和老东家同台竞技。
总体来看,“大模型四小龙”的四位创始人履历非常光鲜,都是各自领域里的精英,但同时他们又各有特色,导致每家公司的气质和侧重点有所不同,进而导致了竞争策略的差异。
融资、估值与站队
四家公司都有融资,估值涨得很快。
目前估值最高的是智谱AI,市场传闻在6月初的一笔融资中,智谱AI估值约30亿美元,中东石油巨头沙特阿美旗下基金投了4亿美元。
月之暗面与智谱AI接近。今年2月由阿里领投的那笔超10亿美元融资中,月之暗面估值已达约25亿美元,这是当时国内AI大模型公司获得的单轮最大金额融资。最新传闻是,腾讯或将入局,将月之暗面的估值推高至30亿美元。
这意味着,智谱AI和月之暗面将率先进入“200亿人民币俱乐部”。
MiniMax和百川智能的估值相对低一些,融资轮次也相对较少。今年3月有消息称阿里领投了MiniMax新一轮大规模融资,估值超过25亿美元。百川智能官宣的融资停留在去年10月,今年4月有传闻称最新估值18亿美元,百川智能否认了。
由于月之暗面和百川智能在2023年上半年才成立,那段时间也是国内大模型投融资最热闹的阶段,所以几笔金额较大的融资,基本都集中在过去一年里。
这四家公司由于被业内认为是头部项目,融资时遭到投资机构拥抢,加剧估值上涨,吸走了行业里的活跃资金。反观那些腰尾部的项目,融资则没那么容易,估值也没这么疯狂。
天眼查数据显示,李开复创办的零一万物,除了公司成立时获得了创新工场的启动资金,对外只获得了阿里云的一笔投资;知乎CTO李大海担任CEO的面壁智能,成立至今获得两笔融资;微软前全球副总裁姜大昕创办的阶跃星辰,没有公开的融资纪录。
跟十年前的那波AI创业潮相比,今天的资金更加理性,或者说是局部疯狂。当年“AI四小龙”融资时,行业里有大量流动的热钱,项目在资本泡沫中长大。
而大模型遭遇了资本寒冬,美元基金退潮,能拿出大钱的大基金不多,头部几个基金抢项目又很强悍,VC对着十来家大模型公司猛投,项目估值一时被拉到很高。
英诺天使基金合伙人王晟对「定焦」说,“百模大战”中很多投资机构陷入迷茫,资金端20多家VC投资很活跃,资产端就几十个项目融了很多钱,两边都没有泛化。实际活跃的投资机构也就20来家,剩下的都是在看热闹,跟着摇旗呐喊。“因为大家第一看不懂,第二不敢投,第三投不到。一堆创业者各种鼓吹项目多厉害,其实根本没人投。”
项目和基金都在扎堆。王晟认为头部几个项目的估值被拉的过高了。
红杉资本投资了“大模型四小龙”中的三家——月之暗面、智谱AI、Minimax,此外还有光年之外和阶跃星辰。今日资本也投资了光年之外,还投了“大模型四小龙”中的两家——月之暗面和智谱AI。
除此之外,“大模型四小龙”从一开始就进入了大厂的射程,主动或被动接受了大厂的投资,提前选边站队。
这与“AI四小龙”时代有很大不同,当年的AI创业浪潮完全由创业公司主导,互联网大厂基本没怎么参与,它们还在忙着抢地盘、大并购,那是消费互联网的黄金时代。今天的大模型创业,OpenAI发布ChatGPT之后,大厂从第一天就下场了,甚至比很多创业者还早,没有给创业公司留出时间差。
大厂基本都是两手准备,一手自研,一手投资。
最典型的是阿里,它除了全力推进自研大模型通义千问,还投资了场上几乎所有的头部项目——“大模型四小龙”+零一万物。腾讯投资了“四小龙”中的三家——Minimax、智谱AI、百川智能,接下来有可能投资月之暗面,另外它此前还投了王慧文的光年之外。美团收购了光年之外,还投资了智谱AI、月之暗面。
从项目的视角来看,智谱AI背后站着阿里、腾讯、美团;百川智能背后有阿里、腾讯、小米;月之暗面是阿里、美团;MiniMax是腾讯。
如果我们相信顶级投资机构和大厂的眼光,以融资情况来看,智谱AI、百川智能、月之暗面、MiniMax这四家公司,毫无疑问是公认的头部,即便它们是被“捧”出来的。
如何赚钱?
“AI四小龙”当年也从投资人手中拿了很多钱,但最后从市场上没赚到多少钱。它们的技术很好,商业化很难,客户主要是B端企业和G端政府,通过向它们提供人脸识别等AI解决方案来赚钱。
这不是一个好的商业模式,项目非标准化、落地周期长、成本高,导致后来一提到“AI四小龙”,就跟亏损、烧钱的标签混在一起。
“大模型四小龙”同样要面对来自商业化的拷问。
四家公司中,智谱AI最早进行商业化探索。按照智谱AI自己的说法,公司从成立的第一天起就有收入,在研究技术的同时也在开拓市场。因为智谱AI一开始的研发重点是数据挖掘与科技情报分析,2020年6月OpenAI发布GPT3后,智谱AI才将重点转向大语言模型。
然而这不能证明智谱AI跑通了大模型的商业模型,反而说明它从一开始就有To B基因,像是上一代视觉AI公司的翻版。
2023年初开始,智谱AI开始组建大模型的商业化团队,人员规模一度发展到上百人,而很多大模型公司所有人加起来都不到一百人。它探索出API、云端私有化、本地私有化等几个主要的变现方式。
智谱AI有意无意进入了巨头的射程范围。今年5月,大模型公司掀起价格战,字节、阿里、百度、腾讯全部卷入其中,将API价格降到无限逼近零。业内普遍认为,大模型创业公司的成本比大厂高,专用数据少,很难建立壁垒,无力与巨头打持久战。
出身相对“平民”的月之暗面和MiniMax,选择从C端入手,靠产品说话。
杨植麟说过,月之暗面不是为了竞争而建立的公司,不做to B,从第一天就决定做to C。
作为一个学院派创业者,杨植麟被认为是典型的“技术信仰派”,带有一点理想主义,相信scaling law,而不只是盯着眼前的竞争。
它去年10月推出的面向C端的产品“Kimi智能助手”,被网友称为ChatGPT中文平替,热度和月活一度逼近百度的文心一言。今年3月,Kimi宕机上了热搜,然后被股民盯上,炒作“Kimi概念股”,让这款产品加速出圈。
通过Kimi,月之暗面向外界证明了自己的技术实力和产品能力,为变现奠定了基础,随后推出打赏模式,但这块的收入还很薄弱。有意思的是,当时Kimi火了之后,阿里在第一时间宣布,通义千问免费开放1000万字长文档处理功能,超过Kimi。而当时阿里刚成为月之暗面的股东。
MiniMax应该是目前C端产品做的最成熟的大模型公司之一,它的突破口是AI情感陪伴。
第一款产品Glow,上线四个月收获500万用户,随后因涉及隐私和敏感问题遭到举报被下架,后来Glow以升级版本“星野” 卷土重来,去年底月活用户达到数百万人。MiniMax还开发了一款AI虚拟人物聊天软件Talkie,主打出海,上线一年时间累计下载超过1400万次。Data.ai数据显示,2024年4月,Talkie的日活跃用户数超过900万。
MiniMax很会做产品,非常精准把握了年轻一代的消费喜好。比如Talkie最大的卖点是AI角色定制,AI角色又与卡牌游戏机制相结合,这些卡牌不仅可以收藏,还能在平台上交易。Talkie让用户付费订阅,同时通过抽卡机制让用户充值,还在抽卡环节插入广告。
当其他大模型公司还在拼参数时,MiniMax已经找到落地场景并开始赚钱了。
百川智能切入市场的方式是开源。Meta靠开源在AI圈一炮打响后,百川智能选择跟随,在公司成立两个月后就发布了70亿参数的开源大模型,随后不断进行升级,通过开放API接口的方式进入ToB领域,开启商业化进程。
王小川考虑的问题很大,像大多数大模型公司CEO一样,他也还在探索最适合公司的商业化落地方式。
结语
站在今天的时点,评选“大模型四小龙”可能还有点早,毕竟,这个赛道还处在早期,存在太多变数。上文提及的四家头部公司之外,零一万物、面壁智能、阶跃星辰也都很有实力,只是暂时在估值、产品落地、商业化等方面略逊一筹。
现在大家都在等待超级应用出现,超级应用可能会成为改变行业格局的跷跷板。大模型公司们都在往这个方向努力,因为如果应用跟不上,商业化的空间就无法打开,靠融资推动的商业模式也就难以为继。
在那之前,“大模型四小龙”需要突破技术天花板,找到落地场景,平衡好与巨头们的微妙关系,甚至被迫参与价格战。它们面对的挑战,丝毫不比“AI四小龙”小。
更新于:4个月前