中国开源大模型、论文、专利的数量,领先美国

2024-08-27 12:17
摘要:8月26日,美国著名非营利科技智库ITIF在官网发布了,一份名为《中国在AI领域的创新程度如何?》的深度调查报告。其实这份报告更像是一份成绩单,主要揭示了中国在大模型、生成式AI领域的发展现状,包括开源模型的能力..

8月26日,美国著名非营利科技智库ITIF在官网发布了,一份名为《中国AI领域的创新程度如何?》的深度调查报告。

其实这份报告更像是一份成绩单,主要揭示了中国大模型生成式AI领域的发展现状,包括开源模型的能力、论文/专利数量、科研机构、顶级AI公司、投资水平等维度,并与美国进行了横向对比。

主要发现如下:

中国目前是全球AI研究出版物的领导者,在生成式AI领域中国与美国并驾齐驱。

北京清华大学是中国领先的AI初创企业的温床,孕育出了生成式AI领域的 “四大天王”——智谱AI、百川AI、月之暗面和MiniMax。

中国大模型正在缩小与美国的性能差距,在中英双语基准测试中,一些中国模型的性能已经超过了美国企业。

中国私营企业的AI投资数量少于美国,但外国对中国生成式AI领域的投资正在增长,其中沙特阿拉伯的阿美公司是主要投资者。

国家层面引导的资本基金和财政援助,正在支持那些有高潜力表现的私营企业。

中国的开源大模型生态正在迅猛发展,阿里巴巴的Qwen1.5和智谱AI的ChatGLM3等模型,超过了一些美国的同行并因其出色的能力获得了认可。

美国的政策制定者不应该以优先考虑遏制中国发展为主要目标,而应当制定并资助一项全面的国家AI战略,以实现增加AI开发和应用的双重目标来保持领先地位。

下面「AIGC开放社区」将根据这份报告,为大家解读一下中国目前在生成式AI领域的主要成绩单。想查看全部内容可以去ITIF。

中国开源模型处于领先地位

根据最新在中文综合基准测试平台SuperCLUE的常识推理、数学、编码和阅读能力等性能表现来看,只有OpenAI的GPT-4o以81分处于第一的位置,但这个是一个闭源模型。

阿里开源的Qwen2-72B 指令微调模型的性能已经与知名闭源模型Anthropic的Claude-3.5-Sonnet-200K并列排名第二达到77分,超过了Llama-3-70B指令微调、Phi-3-mini等知名美国开源模型。

而智普AI开源的ChatGLM3和百川智能的百川2,也优于谷歌的Gemma系列和Meta的Llama2系列。中国零一万物开源的YI系列性能也非常不错。

中国在生成式AI创新

中国在AI研究论文的数量上排名世界第一,与美国相比,其论文的引用次数较少。但在生成性AI这一新兴领域,截止到2023年,中国发布的论文数量为12450篇,略领先美国的12030篇

生成式AI论文方面「AIGC开放社区」还是深有感触的,在arxiv、IEEE、ACM、Nature等顶级平台上,几乎每天都能看到中国发布的论文。

在学术研究机构,中国科学院、清华大学、上海交通大学、浙江大学进入排名前10,其中,综合研究水平中国科学院、清华大学排名前二,超过斯坦福和谷歌母公司Alphabet。

中国生成式AI专利断崖式领先

自2013年以来,中国一直是全球AI专利的最大来源国,是美国的4倍,比全球其他国家加起来还要多。中国的AI专利涵盖了从基础算法、数据处理到行业应用等多个技术领域,显示出中国在AI技术全链条上的创新能力。

中国的AI专利不仅在数量上增长迅速,而且在支持产业发展和转型升级方面发挥了重要作用。许多专利技术已被应用于智能制造、智能医疗、智慧城市等关键领域,推动了产业的创新发展。

在生成式AI领域,中国同样远远超过美国。在申请专利排名前20的企业中,14家来自中国,4家美国企业,2家日本企业;前5名当中4家是中国企业,只有IBM排名第五

中国拥有顶尖AI人才

人才对于一个国家的创新能力至关重要,因为它提供了开发新技术和发展经济所需的专长、创造力和解决问题的能力。投资吸引、培养和留住AI人才的国家更有可能实现长期经济增长,并在全球经济中保持竞争优势。

中国在AI人才的培养方面处于领先地位,特别是在顶尖AI研究人员的产出上。例如,在神经信息处理系统会议(NeurIPS)上发表论文的中国研究人员比例很高。这个会议是AI领域最著名和最具选择性的会议之一,能在这个平台上发表论文的研究人员被视为精英。

数据显示,2022年中国产生了全球47%的一流AI研究人员,而在2019年这一比例仅为29%。对于最顶尖的2%的AI研究人员来说,26%来自中国,相比之下美国为28%,但中国的这一比例已经从2019年的10%显著增长。

虽然人们普遍认为中国面临人才流失的问题,但最近的数据表明,越来越多的优秀中国研究人员选择留在国内。例如,清华大学毕业生到美国留学的比例从2018年的11%下降到了2021年的3%

此外,清华大学还是中国AI的发源和孕育地之一,目前知名的AI研究人员和初创公司,几乎都和清华有一些关系。

ITIF表示,纵观全球能挑战美国在生成式AI赛道霸主地位的只有中国。并且说中国只会复制这是一个错误的说法,因为中国拥有大量创新科研机构,例如,清华大学这样卓越的学校。

虽然整个生成式AI赛道,目前美国还是处于领先地位,但ITIF认为,中国对该领域的重视与大力投资赶超美国只是时间问题。

关于ITIF

ITIF成立于2006年,总部位于华盛顿特区。ITIF在智库和学术界享有很高的声誉。它的研究报告和政策分析被广泛引用,并且其研究方法和结果得到了同行的认可,在科技政策研究领域占据了重要地位。

此外,ITIF的研究报告和政策建议经常被美国政府、国会和各州政府所参考。许多政策制定者和立法者依赖ITIF提供的分析和建议来制定和调整相关的科技和创新政策。ITIF的研究成果对关键政策领域,如宽带互联网普及、人工智能发展、网络安全、隐私保护和数字贸易等都有深远影响。

更新于:3个月前