大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒
开源大模型还是闭源大模型,究竟谁才是“版本答案”?围绕这个问题,360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。
先是在4月12日,有媒体曝光了李彦宏在百度内部的讲话。其中就有他认为闭源大模型在能力上会持续领先、而不是一时领先,并且开源大模型的运行模式和传统开源软件不同、不是众人拾柴火焰高,闭源是有真正的商业模式、并能够赚到钱,只有能赚到钱才能聚集算力和人才。
紧接着在4月16日举行的Create2024百度AI开发者大会上,李彦宏在演讲中就宣称,“开源模型会越来越落后”。
就两天后的第二十七届哈佛中国论坛上,自称开源信徒的周鸿祎站出来唱了反调,“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”
其实在国内市场,大模型的开源、还是闭源并不是一个技术问题。无论闭源、还是开源,这一众大模型客观上的性能还逊色于海外的同类产品,它们也都不是在大模型技术层面的引领者。而单纯在技术层面,目前闭源大模型在能力上处于领先,诸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra就都是闭源,国内的情况也一样,百度的文心一言、阿里的通义千问、字节跳动的云雀、月之暗面的Kimi等叫得上号的大模型,也通通都是闭源。
周鸿祎认为,开源模型为整个社区提供了一个共享、协作和创新的平台,推动了技术的快速发展,开源社区聚集的工程师和科学家的数量是闭源的数百倍,所以今年开源大模型只做了一年,就已经超过了GPT-3.5的能力。然而实际情况远没有他所说的那般乐观,不管从模型能力层面、还是在产品落地的维度,事实是开源大模型还始终落后于闭源大模型。
尽管Meta方面刚刚发布的Llama3确实做到了性能优于GPT-3.5,可问题是谁都不会认为Llama3是开源社区的产物,毕竟其核心开发力量自始至终都来自Meta。
事实上,考虑到李彦宏和周鸿祎早已远离一线,所以两者关于大模型开源和闭源的观点相左,或许并不是对于技术路线的分歧。因此有观点认为,一方支持闭源、另一方相信开源的力量,其实更像是各自所代表商业利益的驱使。
周鸿祎支持开源模型的原因其实很简单,毕竟在如今的“百模大战”里,360智脑还处于追赶者的地位,在用户规模和对业界的影响力上都逊色于文心一言、通义千问等互联网巨头推出的大模型。
此前360方面在开源360智脑7B模型时就说得很清楚,“大家没必要重复造轮子”,言外之意就是AI创业者不用再自研了,直接使用开源360智脑的能力就好。纵观软件业的发展史,商业公司通过开源来获得某一赛道的领导权其实是非常经典的操作,比如谷歌就靠开源,让Chromium生态得以一统PC浏览器市场。
从某种意义上来说,周鸿祎的360开源自家大模型,其实是复刻Meta开源Llama的操作。既然自称是开源信徒的周鸿祎有私心,坚持闭源大模型更好的李彦宏,其实也有自己的小算盘。
李彦宏在对开源模型泼冷水的同时还表示,“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”
这句话的言外之意,就要联动他在一年前的公开发言了。在去年夏季的世界互联网大会数字文明尼山对话上,李彦宏在主题演讲中就曾表示,“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。”
在这不同时间的相似论述背后,其实是李彦宏想劝退大模型创业者,并希望他们直接加入百度的AI生态。而百度的底气,则来源于抢占了先发优势的文心一言,基于更大的算力、更多的数据和更强的算法,依托飞桨平台,从文心3.0、3.5,到4.0,文心大模型的能力也逐渐增强。
相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%、推理性能提升了105倍,推理的成本更降到了原来的1%。
此前百度CTO王海峰就曾透露,目前文心一言累计用户规模已达2亿,日均调用量也达到了2亿;飞桨文心生态已聚集1295万开发者、服务24.4万家企事业单位,基于飞桨和文心创建89.5万个模型,利用千帆平台开发的AI原生应用数量更是超过了19万。
所以百度想要的其实是类似OpenAI那样建立AI生态,并以文心一言为支点进行平台化。如此一来,百度方面希望大模型赛道的参与者自然是越少越好,一旦创业者都去开发AI应用、而非大模型,自然就有可能会重演当年App Store的故事。
多年以来持续在AI领域投入的百度无疑是国内AI大模型的先行者,而其AI领域实现的增量收入也反映在了2023年的财报中,但绝对值却并不大。因此对于几乎错失了整个移动互联网时代的百度而言,夯实自家AI生态、并提升AI业务的货币化能力,无疑就是目前的头等大事。而相比于自己来做产品,做应用商店来“收税”显然会是个更好的选择。
归根结底,大模型到底是开源好、还是闭源更佳,目前在技术层面暂时还没有分出高下,但闭源或开源对于不同公司的商业利益却各有优劣。
更新于:6个月前