吃“有毒”数据,大模型反而更听话了!来自港科大&华为诺亚方舟实验室

2023-10-28 13:17

现在,大模型也学会“吃一堑,长一智”了。来自香港科技大学和华为诺亚方舟实验室的最新研究发现:相比于一味规避“有毒”数据,以毒攻毒,干脆给大模型喂点错误文本,再让模型剖析、反思出错的原因,反而能够让模型..

谨防大模型基准评估陷阱!测试集乱入预训练,模型变傻

2023-11-09 13:39

最新研究警告,大型模型在基准评估中可能面临潜在危害,原因是测试集中的数据可能意外进入预训练过程。这项研究由中国人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校的学者联合进行。研究发现,..

把大模型装进手机,总共分几步?

2023-11-15 14:02

年初ChatGPT爆火的时候,我去上海参加华为春季新品发布会,用一页keynote提到了大模型技术与手机硬件的结合。虽然只有短短的一两分钟,但我专门发了一条朋友圈,看好自然语言交互能力在手机上的应用。当时我就有预感..

Nature:大模型只会搞角色扮演,并不真正具有自我意识

2023-11-20 13:46

大模型正变得越来越“像人”,但事实真是如此吗?现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已!无论是GPT-4、PaLM、Llama2还是其他大模型,在人前表现得彬彬有礼、知..

大模型界的“熊猫烧香”,可对文生图模型造成巨大伤害!

2023-11-26 12:18

《麻省理工技术评论》分享了一个名为Nightshade的投毒工具,可以对DALL-E、Midjourney 和Stable Diffusion等文生图模型的训练数据造成造成巨大伤害,以帮助艺术家们防止非法爬取其画作数据,用于大模型训练,同时揭..

伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练

2023-11-29 12:22

要点:由加州大学伯克利分校研究人员推出的Starling-7B是一款基于Reinforcement Learning from AI Feedback(RLAIF)的开放式大型语言模型(LLM),采用人工智能反馈来提升其性能,特别是在聊天机器人响应方面。RLAIF采..

一言不合就跑分,国内AI大模型为何沉迷于“刷榜”

2023-12-03 13:27

“不服跑个分”这句话,相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件,由于能够在一定程度上反映手机的性能,因此备受玩家的关注。同理在PC处理器、显卡上,同样也有相应的跑分..

AI大模型,如何破圈而出?

2023-12-05 12:54

一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的“百模大战”。但有个问题不知道..

思维链提出者Jason Wei:关于大模型的6个直觉

2023-12-07 13:34

大模型究竟从下一个词预测任务中学到了什么呢?还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 Cha..

华中科技大学开源多模态大模型Monkey

2023-12-09 14:19

要点:1、Monkey 是一种高性能多模态大模型,可在复杂场景和视觉细节处理方面提供出色的性能。2、Monkey 无需从0预训练,可以基于现有视觉编辑器进行构建,将大模型的输入分辨率能力提高到896x1344像素。3、Monkey 采..

微信二维码