Gemini 是谷歌迄今为止最佳的 AI 模型 但充满希望的基准测试和演示最终引发了批评

2023-12-21 13:56
摘要:谷歌近日公布了其最新的人工智能模型 Gemini,旨在缩小与 OpenAI 之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性(尽管是功能受限版本),彰显了..

谷歌近日公布了其最新人工智能模型 Gemini,旨在缩小与 OpenAI 之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性(尽管是功能受限版本),彰显了谷歌的自信。

然而,随着 AI 工程师和爱好者深入探究细节后发现了一些缺陷,这股积极氛围逐渐转变。虽然「Gemini」在技术上令人印象深刻,有望最终挑战 GPT-4 的主导地位,但谷歌模糊不清的信息传达方式使其不得不处于防守状态。

北美某大型零售商的首席 AI 工程师 Emma Matthies 表示:「目前问题多于答案。我发现谷歌宣传视频中的展示与其技术博客中的细节之间存在不一致。」

谷歌陷入困境的演示

Gemini 的演示视频在 YouTube 上发布,题为「亲身体验 Gemini」,视频风格快节奏、友好、有趣,充满易于理解的视觉示例。然而,它对「Gemini」的工作原理有所夸大。谷歌代表声称该演示视频展示了「Gemini」的真实提示和输出,但编辑过程省略了一些细节。例如,「Gemini」的互动是通过文本进行的,而不是语音,AI 解决的视觉问题是通过图片输入的,而不是实时视频

此外,AI 开发者迅速意识到「Gemini」的能力并不如最初看起来那样***性。

性能比较

谷歌在其基准测试数据上也受到批评。家族中最大的模型「Gemini Ultra」宣称在多种基准测试中超越 GPT-4,这在大体上是正确的,但引用的数据是为了将「Gemini」描绘得更加优秀。

谷歌使用与其他公司不同的方法来测量性能,用户提示 AI 模型的方式会影响其性能,只有在使用相同的提示策略时,结果才具有可比性。

尽管如此,「Gemini」的多模态功能仍然令人印象深刻。它能够跨文本、图像、音频、代码和其他媒介进行推理。虽然这并非「Gemini」所独有,但大多数多模态模型要么未公开,要么使用困难,或专注于特定任务。这使 OpenAI 的 GPT-4 在这一领域中占据主导地位

未来展望

「Gemini」的命运尚未确定,取决于两个未知因素:「Gemini Ultra」的发布日期以及 OpenAI 的 GPT-5

尽管用户现在可以尝试「Gemini Pro」,但其更强大的兄弟版本将于 2024 年某时发布。AI 领域的快速发展使得人们很难预测 Ultra 发布时的情况,同时也给了 OpenAI 足够的时间来用新模型或对 GPT-4 的适度改进作出回应。

更新于:11个月前