2026年一手实测!Claude3 VS ChatGPT-4 孰强孰弱?

一手实测!Claude3 VS ChatGPT-4 孰强孰弱?相信大家在 pyq 都被这张图片刷屏了把 昨天 为大家介绍了一下什么是 Claude 今天咱终于弄到号了 再被 ban 了 3 个号之后终于是成功的登上去了 如果各位看官觉得咱文章写的不错 麻烦点个小小的关注 你们的支持就是我最大的动力 给大家来一波 Claude3 与 GPT 4 的测试 看看 Claude 到底是不是网传的那样全方位吊打 GPT 4 在进行测试之前我们先来看一组 Claude 官方发布的数据

大家好,我是讯享网,很高兴认识大家。




讯享网

相信大家在pyq都被这张图片刷屏了把~

昨天,为大家介绍了一下什么是Claude,今天咱终于弄到号了(再被ban了3个号之后终于是成功的登上去了,如果各位看官觉得咱文章写的不错,麻烦点个小小的关注~你们的支持就是我最大的动力),给大家来一波Claude3与GPT-4的测试,看看Claude到底是不是网传的那样全方位吊打GPT-4


在进行测试之前我们先来看一组Claude官方发布的数据

Anthropic公司本次一共发布了3个模型,分别为:

Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,其费用与模型能力如下图所示:

再三个模型中,Oups是最强大的,同时也是费用最高的,目前Sonnet是可以免费使用的模型(也是本次测评中用到的模型),同时也是一个性价比较高的选择。每个模型都在智能、速度和成本之间提供了**的平衡,以适应各种特定应用的需求。

Claude 3 Opus: \(15 / \)75

Claude 3 Sonnet:\(3/\)15

Claude 3 Haiku: \(0.25 / \)1.25 

Opus的定价与GPT-4相当,高于GPT-4 Turbo,低于GPT-4 32K

Sonnet比所有GPT-4版本(包括GPT-4 Turbo)便宜

再这组数据中,Claude官方从本科水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)、数学问题解答(MATH)、多语种数学(MGSM)代码编写(HumanEval)等八个方面对Opus  Sonnet   Haiku以及GTP4和GPT3.5几个模型展开了比较。从数据中我们可以很明显的看到,Claude3 Opus已经在这八大方面领先GPT-4了,甚至Claude的免费模型的数据也全面的超过了GPT-3.5(奥特曼此时估计已经坐不住了0.0)


跟同行的对比说完了

小讯
上一篇 2026-03-09 15:46
下一篇 2026-03-09 15:48

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/209378.html