上周,AI领域又出了一个大新闻,这次的主角是Anthropic公司发布的Claude3的大模型。自其发布以来,各大技术评测都在宣扬它的强大能力,并声称claude3在多个技术维度上已经超越了OpenAI的GPT4模型,各路媒体纷纷响应,诸如“一夜变天”、“OpenAI跪了”的标题令人眼花缭乱。
那么真相究竟如何呢?首先,让我们来看看Claude3的具体情况。这次发布中,Claude3共推出了三个版本,分别是速度最快的Haiku、能力最均衡的Sonnet,以及能力最强大的Opus。在各种评测中,所谓的Claude3超越GPT4,实际上指的是Opus版本。
与以往版本相比,claude3明显减少了拒绝回答的情况,而对图片和长文的识别也变得更加准确和迅速。
看上去,claude3确实更聪明了,然而这并不是什么新闻,这只是大模型混战中必然会发生的众多类似故事中的一个而已。
自从2022年11月ChatGPT发布,所有大模型公司都在进行军备竞赛,经过一年的发展,AI产品进入到了多样性极大丰富的阶段,各家公司都在竞相研发出更优秀的产品。在过去一年中,占比一半以上的重要科技新闻都与AI方面的突破有关,但这并不意味着每一个突破都是真正意义上的创举。
那哪些事件可以称得上创举呢?比如ChatGPT和GPT-4的发布是创举,sora的发布也是创举,而其他所谓的技术突破大都是在原有技术上做增量工作,很难能称得上真正的创举。
事实上,如今的AI行业正处于技术丰饶期,机遇与风险并存。在这种情况下,很多产品虽然看似突出,但实际上只是对某一特定指标的提升,并未在整体上带来革命性的变化。
以claude3这次事件为例,不少的评测报告显示claude3只是在某些特定测试中略微领先GPT-4,并没有呈现出令人惊讶的能力,更何况,它对标的还是一年前发布的GPT-4,如今OpenAI的大模型技术天花板究竟在哪里,外界只能依靠想象。
这和sora在视频生成质量和时长上的突破、GPT-4在多模态领域的认知突破带给人类世界的惊艳程度是不可同日而语的。
所以,在AI资讯狂轰滥炸的时候,我们应该保持清醒的头脑,将注意力集中在最有价值的地方,我们更需要分辨出哪些是噪音,哪些是有效的信息。例如那些性能暴增的突破是值得关注的,而性能暴增的特征就是,在主要性能指标上超越平均水平一个数量级。这种现象在一个领域的竞争末期是几乎不会出现的,而在竞争初期却时有发生。正是这些超越对手一个数量级的突破不断地堆叠,才塑造了竞争末期产品的形态。而在竞争早期,头部的几位玩家,谁跑得稍微慢点,谁暂时领先了,这些对于竞争终局和技术终局来说,无关紧要。
所以这次的Claude3,确实没什么大新闻。
以上内容来源于《中国企业家》杂志。
更多关于AI领域的发展和变革,请订阅并收听《AI实践真知课》,我们将第一时间为你们带来最新鲜、最前沿的AI趋势解读。
听完之后,你认为Claude3和GPT4谁更胜一筹?欢迎大家留言告诉我。
听友220385252
约翰儿
老三,这次还像个格格的样
约翰儿
坚持坚持,进取进取
约翰儿
老三是宰卖野田心不疼
CJMl
我