AI的“去泡沫时代”,与驱动百度的三驾马车
不可否认,本轮生成式AI浪潮,同样出现了预期过高的“泡沫”状态,但由于生成式AI的重资产投入特性,一些徒有其表的“伪创新”将会被毫不留情地清洗。大浪淘沙之后,以百度为代表的一批真正有技术实力、创新精神的公司将会脱颖而出,为社会带来真正的价值。
“这个世界不应该被吞噬,而应该被创造。AI时代,应用创造世界。”
双十一购物节收官的第二天,也就是11月12日,2024百度世界大会在上海世博中心开幕。相较以往,本次世界大会的丰富程度不遑多让。李彦宏在短短1个多小时的时间里,将百度过去一年的技术演进悉数呈现。
图源备注:图片由AI生成,图片授权服务商Midjourney
在过去24个月的时间里,生成式AI的进化速度,超出了大多数人的想象。其中最显著的代表性变化,则是模型的幻觉被极大消除——不仅是文字层面,在图片生成上,一如百度新推出的检索增强的文生图技术 iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片。
另一方面,是模型规模控制日渐娴熟,调优技术的日益演进使然。不过更重要的点在于,相较以往面对基础大模型的简单“套壳”,如今已经有AI搜索、智能体等更成熟的应用加持,其技术力、可信度都实现了质的提升。
在世界大会上,李彦宏指出,过去这24个月,大模型基本消除了幻觉,它回答问题的准确性大大地提升了——这让AI从“一本正经的胡说八道”,变得可用、可被信赖。
不可否认,本轮生成式AI浪潮,同样出现了预期过高的“泡沫”状态,但由于生成式AI的重资产投入特性,一些徒有其表的“伪创新”将会被毫不留情地清洗。大浪淘沙之后,以百度为代表的一批真正有技术实力、创新精神的公司将会脱颖而出,为社会带来真正的价值。
01
生成式AI的“去泡沫时代”
如果将时间轴拉长,AI从诞生开始至今,历经的“泡沫”和“去泡沫”时代,难以数说。
在这次生成式AI浪潮中,又卷模型又卷应用的创业方,成本不仅涵盖了人力、运营,还有算力、模型等昂贵的硬件成本,都需要自行融资承担。这导致无论是出资方还是创业方,其承受的压力比移动互联网时代的创业更大,出清速度也会更快。
正如李彦宏所言,泡沫过后,一些无法满足市场需求的伪创新将会被清洗掉,在这之后,有1%的企业将脱颖而出,继续成长,为社会创造巨大价值。现在,我们只是在经历这个阶段,这个行业比去年更冷静,也更健康。
这段话并非空穴来风,一方面,基于通用大模型稍加修改即上线的“AI产品”,在GPT出世的前一年如雨后春笋,但到现在已经十不存一;另一方面,真正“活下来”,并不断迭代形态的原生AI应用,正以超出预期的速度发展并壮大。
以百度为例,文库业务和智能体等业务的重构与跨越,是李彦宏重点提出的发展目标。
如今回过头来,我们不难发现,李彦宏年初画下的“大饼”,如今多数已成现实。
譬如公司类的智能体,它相当于AI时代的企业官网,原有的公司介绍、产品图片、参数展示等必要信息一应俱全,还能针对用户特征和需求进行智能推荐,替代人工进行及时响应和主动服务,帮助客户更全面立体地了解产品。
如今,在百度APP搜索“比亚迪”,就能直接唤起它的官方智能体。除了默认的公司介绍,还能基于自身需求输入各类相关问题,而非以往的“定向问答”。智能体的直接效果则是比亚迪的官方智能体上线后,销售线索的转化率完成了翻番,提升了119%。
再如工具类的智能体,典型者如百度文库和网盘联合开发的工具类智能体——“自由画布”。
据了解,它不仅支持包括文档、图片、音视频等多格式文件的自由输入,还能对上述多格式文件进行AI总结,重点框记,据此完成新内容的AI创作,播客的制作同样也不在话下。需要注意的是,生成的文件,已经不再是单一媒体格式,模态已经多样化。
此时,与网盘的联动价值开始体现——仅仅通过一个链接,就可以通过一个链接,直接实现分享、查看、二次编辑等操作,还能一键存储至百度网盘。
对于范围更大,更下沉的普通C端用户,则到了端到端行业智能体的发力点。但这类专业智能体,仅靠百度一家,同样孤掌难鸣。因此,百度邀请了英伟达作为技术合作伙伴,以“智能体创新大赛”的形式,创造出更多有价值的智能体应用,并为千行百业的用户使用和分享——截至目前,文心智能体平台已经吸引了多达15万家企业和80多万名开发者参与。
02
新生态 新驱动
据弗若斯特沙利文发布的报告《2024年全球AI生态全景概览》,在全球AI生态全景中,百度与谷歌、OpenAI位于AI-Native Giant 同一象限。
当然,这不是简单的“排座次”——当一家AI公司,其模型、应用、生态等层面,已经形成自我造血的“自循环”,方能在其中占据一席之地。
OpenAI作为AI原生巨头,自是有一席之地,但就在几天前,他也不得不坦言,“总体上,产品是我的弱点”。
而要实现商业化,基于可用模型的应用层,则是必由之路,AI厂商“卷应用”的时代,已然到来。
根据李彦宏在世界大会现场的分享,他曾在半年前,与高管们讨论大模型“成了”的标准,“我当时说,如果我们的调用量日均的API调用量,大模型API调用量,一年之内如果涨10倍,也就是从2亿涨到20亿,一年时间涨10倍,我认为就成了,就说明大家是真需要。”
而在半年时间里,文心大模型的日均API调用量增长7.5倍,目前已经超过15亿次,距离李彦宏20亿的目标,已经非常接近。
一方面,这是基于文心大模型的先发优势,在最早时间获取了最大数量的“种子用户”使然;另一方面,其在近两年时间里的进化速度,同样有目共睹。
其中一个显著变化是,基于神经网络技术路线的大模型,其固有的“幻觉”缺陷,已经很大程度上被克服,具体的体现则是回答问题的准确性大幅提升。
众所周知,基于模型内部的“黑盒”属性,其具体的推理过程和模型决策过程,至今仍然难以一窥全貌。它的技术根源在于,AI技术的本质在于对语言的概率模型预测,通过庞大的训练数据对下一个token进行推测。当这种生成机制不足以捕捉复杂的上下文关系时,模型就可能毫无根据地生成显著偏离事实的信息。
百度祭出的解决方案,则是“RAG”技术,它包括两个主要阶段:检索上下文相关信息和使用检索到的知识指导生成过程。这个过程使得大模型能够更准确地回答用户的问题。
截至目前,文字层面的RAG应用已经臻于成熟。日均15亿次的API调用量,一方面是用户“用脚投票”,佐证文心一言的可用,好用;另一方面,源源不断的调用,所产生的新数据,也可用于文心一言的进一步调优,使其准确性更上一层楼。
不过,文生图环节,是相比文生文不遑多让的“幻觉”重灾区,用户对于提示词的不熟练是一方面,生成效果“过于古神”又是另一方面。比较显著的一个例子,则是七八个手指的手掌,和四层楼的天坛。
今年初百度决定解决图形生成的幻象问题,自研的IRAG技术,即是集中的成果体现。它结合了检索和生成的技术方法,可以有效提升生成内容的可靠性和准确性,且对各种指令的理解,精准度更高。
还是以天坛为样本,如果在文心一言4.0turbo里输入“在雪山里的天坛”,如今能“立等可取”的结果,不仅是三层楼的,存在于现实世界里的“真实天坛”,其后的雪山场景,也可以根据用户的各种商业与非商业的需求,生成自己想要的效果,已经无限接近商用场景。
至此,百度也为图生文应用打开了商业化的大门,让生成结果有了真正的用武之地。
03
AI与三驾马车
无论是雨后春笋般涌现的原生AI智能体,抑或是“RAG”加持的文生文、文生图应用,诸如此类的智能产业生态,其稳定运行必须要有稳定的算力提供和针对模型的精调服务,就百度而言,其智能云服务则是主要依托。
作为国内最大的连锁餐饮集团之一,百胜与百度的合作颇具代表性。早期合作阶段,百度先帮助百胜完成了新增门店选址工作,数量达到数千家;
深入到客服领域,针对庞大且复杂的客诉需求,百度提供了大模型加持的客服产品,解决了此前百胜因为难以识别客户真实意图,没法关联上下文的问题。
截至目前,客服应用和解决方案已经覆盖了百胜全线业务,大模型调用量也升至百万级,其“问题解决率”上升到了90%,但这只是一个开始,随着千帆平台、文心Speed模型、基础云算力服务等能力的提供,百胜已经拥有了初步且完善的大模型底座能力,后续的AIGC应用开发计划,已经不再是空中楼阁。
自动驾驶同样也是大模型重构的重点环节。一方面,Apollo自动驾驶开放平台10.0即将发布,将搭载百度最新的自动驾驶大模型ADFM,大模型“上车”的意义,某种程度上与重构其它业务的逻辑一致,在于提升自动驾驶开放平台的安全性、智能化和易用性。
所谓安全性,是指其自动驾驶的安全性要做到人类驾驶员的10倍以上。截至2024年6月,百度自动驾驶实际道路测试与示范里程超过1亿公里,从未发生过重大伤亡事故;为每辆无人车及乘客购买了保额为500万的保险,过去两年的数据显示,实际车辆出险率仅为人类司机的1/14。这也在客观上,为其创造了进军全球的条件。
在世界大会,李彦宏用“AI applications are creating the world”作为了整场演讲的结语(AI 应用正在创造这个世界),他之所以有如此底气,很大程度在于,通过近两年时间的全面重构,百度原有的产品矩阵,借助更集中的用户生态和用户数据,得到了再进一步的可能性。
这不是所谓的“百尺竿头,更进一步”,而是在生成式AI的“军备竞赛”上,无论是卷应用还是卷生态,每在技术和应用上前进一步,意味着整体效率的提升,其身位与后来者,将会拉得更远,而在马太效应极为明显的AI行业,则是“全部带走”和“一无所有”的差别。
很显然,想用AI创造一个世界的李彦宏,和他的百度,在进步或平庸的选择题上,并没有过任何迟疑。
更新于:1个月前