字节大模型内部赛马,下一个爆款 or 烧钱深坑?

2024-10-26 12:37

今年最火的两款全球AI产品,当属视频生成大模型产品Sora和音乐生成大模型产品Suno。今年4月,经Suno爆改的周杰伦金曲《以父之名》和《夜曲》直接封神,在音乐界掀起了一股不小的波澜。不少人认为,这两条赛道会催生..

谷歌展示首个大模型实时游戏模拟引擎,重塑游戏开发流程

2024-10-29 12:16

传统的游戏引擎依赖手动编码,通过循环处理用户输入、更新游戏状态来完成游戏的开发,这种方法费时且成本非常高。谷歌的研究人员基于开源扩散模型Stable Diffusion1.4开发了实时游戏模拟引擎GameNGen,可以在单个TPU..

刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力

2024-10-31 12:22

今天凌晨,OpenAI开源了最新基准测试集SimpleQA,可以帮助开发者轻松检测、校准大模型的真实性能力。目前,很多大模型会出现一本正经胡说八道的问题,例如,你提问NBA历史上得分最多的是谁,它回答是迈克尔乔丹,实..

Sam Altman泄露新模型o2,太会整活了,营销鬼才!

2024-11-04 12:03

善于整活玩猜字谜的OpenAI首席执行官Sam Altman又发了一条神秘消息,“我听说o2在GPQA的性能测试达到105%。”要知道,博士级人类在GPQA的准确率平均只有65%,非专家级的普通人仅有34%。而OpenAI在9月发布的o1模型的..

大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑

2024-11-04 12:31

一群大模型玩你画我猜,人类一旁围观超起劲儿。就像下面这张图展示的,由Grok画长颈鹿,一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。其实这是最近爆火的一种新的测试基准(d..

指令层级,帮助AI大模型防御恶意攻击

2024-11-08 12:08

随着ChatGPT等生成式AI产品被广泛应用在AI代理/客服、虚拟助手等领域,在安全方面会遭遇黑客攻击、恶意文本提示等难题。例如,使用特定的提问方式,可以让ChatGPT输出原始私密训练数据。因此,OpenAI的研究人员提出..

OpenAI o1太贵?那就自己做一个,纯提示方法让普通LLM进化出复杂推理能力

2024-11-08 12:29

近日,一篇文章在推特上爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞..

AI 1.0公司的节节败退

2024-11-14 12:12

商汤科技又裁员了,并不算行业新鲜事,新鲜的是,这次裁员发生在积极拥抱大模型之后。成立于2014年的商汤科技,是2014—2015年的AI1.0创业潮中拿到第一桶金的领头羊,并率先登陆资本市场,成为AI第一股。某种程度上..

外媒:OpenAI 、Anthropic、谷歌新模型表现均不及预期

2024-11-15 12:25

五年内 AGI 还能否如期而至?谷歌、Anthropic、微软和 OpenAI 都是 AI 领域的顶尖玩家,但现在看来,这些公司在开发更先进的 AI 大模型时都遇到了不小的困难。OpenAI 曾接近一个重要的里程碑。9月,他们完成了一个全..

Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿

2024-12-02 12:29

也许是时候寻找新的方法了?大模型回答人类的对话内容,究竟有多少「智能」成分在里面?本周五,知名 AI 领域学者,OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 发表观点:「人们对『向人工智能询问某件事..

微信二维码