让子弹飞一会儿-谷歌大模型Gemini惹争议
美国当地时间12月6日,谷歌旗下的人工智能研究团队deepmind发布了新版人工智能大模型Gemini,其中包括三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备,如手机、平板的Gemini Nano。同时它号称“规模最大,能力最强”,是人类史上第一个超越人类专家水平的大模型。
和重文本的ChatGPT不同,新发布的Gemini更接近人类的感官系统,支持文字、代码、音频、图片、视频五种输入。除了多模态的输入输出,更重要的是Gemini还能在不同模态之间无障碍的交流转换,这意味着用户在使用过程中,可以交错生成不同的文字和图像。
另外谷歌声称,Gemini专业版在八项基准测试中,有六项表现都比GPT-3.5强。同时,他们还拿Gemini高级版和GPT-4做了对比,结果显示Gemini在阅读理解、代码生成等十多项比拼中都比GPT-4的得分更高。
消息一出,技术圈和资本市场顿时一片哗然。
然而,Gemini的强大也遭遇了不少质疑:彭博社专栏作家帕米·奥尔森率先发难:他怀疑谷歌发布的性能演示视频很可能不是实时的,而谷歌宣称超越GPT-4的Gemini高级版还没有正式推出,大家根本没法验证谷歌方面宣称的神奇能力。
随后谷歌方面回应:演示视频使用了原始镜头中的静止图像帧,然后编写了文本提示,以便让Gemini做出回应。
这意味着,Gemini现阶段的能力并没有完全达到视频中的演示效果。
原本这是一场谷歌和OpenAI的技术性能比赛,但目前因为性能演示的透明度问题引起了误导观众的争议。在这一背景下,谷歌的Gemini面临着来自专业人士和市场的质疑和洗礼。
实际上,这看似不明智的背后是谷歌深深的焦虑和危机感。众所周知,谷歌的基本盘在搜索领域,而生成式人工智能被认为是谷歌搜索技术的大敌。
老牌科技公司微软通过大力投资科技新星OpenAI,已经重塑了自身的产品线,大有泰山压顶之势。而谷歌这次“快进”式发布Gemini,也侧面反映了它对于维护自身实力和市场地位的迫切愿望。
综合来看,Gemini的发布既是技术进步的体现,也是市场竞争的重要一环。然而,透明度和真实性问题需要引起重视,经历质疑之后,Gemini在未来还将和它的竞争对手继续较量。
虽然目前仅开放了Gemini Pro和Nano,但Gemini Ultra在测评基准上取得的成绩已十分亮眼,尤其是代码生成能力方面。这无疑是在OpenAI陷入内部混乱的时候给了它重重一击。
不管怎么样,谷歌Gemini的发布还是给了其他AI团队很大的信心,GPT-4从此不再是独一无二、难以企及的存在了。同时,OpenAI也是有机会被其他团队追赶甚至超越的。
听完之后,你觉得Gemini会在未来全面超过ChatGPT吗?
用户评论