搜索

黄冈钢绞线 矿用 A社你评释下,啥叫Sonnet 5比Fable 5还贵?

发布日期:2026-07-01 22:34 点击次数:120

钢绞线

刚刚黄冈钢绞线 矿用,Claude 又又又新了。

但此次不是旗舰,Anthropic 出了新版价比模子 Sonnet 5。

A 社把它定位成迄今杀青"颖异活"的 Sonnet,能我方联想任务、调用浏览器和末端。

其跑分靠拢自贵的 Opus 4.8,价钱却只消后者的六成傍边,实在款" Opus 平替"。

具体数字摆在何处,其 agentic coding 跑分 SWE-bench Pro 63.2,比上代 Sonnet 4.6 出 5 个百分点。

标价则是跟 4.6 比字不差,从发布会的口径上看,才略涨了,价钱没涨。

真的没涨……吗?

配置者 Simon Willison 了件浮浅的事,把同段笔墨分辩喂给新旧两个模子计数。

遵循发现,Sonnet 5 天然名义上价钱样,但账单上的 Token 消耗数字悄悄涨了三成。

好你个 A ÷,搁这玩起偷梁换柱那套了。

" Opus 平替"

Sonnet 5 此次升的,是 Agentic 才略的进步。

模子不错我方拆罢职务、调用浏览器和末端这类用具,把件多纪律的活语气干完,中间不掉链子,干完之后还会主动查验遍我方的输出,毋庸东谈主提醒。

跑分上能看到具体的台阶。

agentic coding 测试 SWE-bench Pro,Sonnet 5 拿到 63.2 分,Sonnet 4.6 是 58.1 分,Opus 4.8 是 69.2 分,Sonnet 5 站在两代之间,离 Opus 只差 6 分。

computer use 测试 OSWorld-Verified,Sonnet 5 是 81.2,Opus 4.8 是 83.4,差距缩到 2.2 个百分点。

而在学问使命类测试 GDPval-AA v2 上,Sonnet 5 拿到 1618 分,反而比 Opus 4.8 的 1615 分还出 3 分。

早期用上这款模子的两公司给出的响应印证了这点黄冈钢绞线 矿用。

AI 编程平台 Factory 的工程师 Zimu Li 说,Sonnet 5 给他们的智能体提供了层塌实的实行才略,能在散乱的技能环境里捏续编码、调用用具、排查问题,尤其适那种需要万古期跟进、对技能细节条款的使命流。

自动化平台 Zapier 的工程师 Daniel Shepard 给了个具体的例子,他们交给 Sonnet 5 项两段式任务,先新 Salesforce 里的客户账户等,再给企业客户发封居品上线公告邮件。

这种任务昔时时常卡在中间,比如账户等改收场,公告却没发出去,或者反过来。此次 Sonnet 5 把两段任务重新跑到尾,莫得半途停驻来等东谈主接办。

Shepard 的原话是,对日常自动化来说,这种模子毋庸多思就该用。

Anthropic 同期公布的安全评估遵循,跟这条干线是配套的。

Sonnet 5 的幻觉率和奉迎倾向王人比 Sonnet 4.6 低,在自主调用用具的场景下,Sonnet 5 也能抵牾教唆词注入这类劫捏抨击。

并且这组能数字放在价钱控制看,意味才显出来。

Opus 4.8 的标价是每百万输入 / 出 Token 要 5/25 好意思元,Sonnet 5 则是 3/15 好意思元,只消 Opus 的六成傍边,重复 8 月底前的限时惠则只消四成。

从账面上看(记取这五个字,要考),能够到对九成以上,价钱却只消四到六成,Sonnet 5 实质上即是款 Opus 平替。

Sonnet 5,真的低廉吗?

能这条线讲收场,价钱这条线初始披露另面。

Sonnet 5 用了套新的分词器,也即是模子把笔墨切成 Token 的式。

新的分词器当中,同段笔墨现时被切成了多份 Token,算下来的总用度天然就比以前。

发现这点的,是配置者 Simon Willison。

他莫得停在官那句"价钱不变"上,总结拿我方写的 Token 计数用具实测了几份不同讲话的真实文档。

其中英文版,钢绞线Sonnet 4.6 算出 2356 个 token,Sonnet 5 算出 3341 个,涨了 42,西班牙语版涨了 33。

份 4279 行的 Python 代码黄冈钢绞线 矿用,Token 数则是从 44014 涨到 56118,涨了 27。

唯简体华文版简直没动,从 3334 涨到 3360,只多了 1。

同次分词器换代,对不同讲话的影响差出去四十多个百分点,这个反差自己比加价这件事值得多看眼。

把这几个数字摆在起,能看出"单价不变"这句话莫得说谎,但也莫得说全。

相通段英文笔墨现时要花掉的钱,比 Sonnet 4.6 时期多出四成多。

但这么算下来,应该也比 Opus 低廉?遵循很快就有配置者来脸了。

这名配置者发现,实质运行当中,Sonnet 的消耗比 Opus 还贵。

跑个 Artificial Analysis Intelligent Index 上的任务,Opus 4.8 平均(加权)要花 1.8 好意思元,而 Sonnet 5 要 2.29 好意思元,多出了 27。

他稀零发现,关于同个任务,Sonnet 5 消耗的 Token,果然达 Opus 的两倍。

如若看跑完系数 Benchmark 的消耗,那 Sonnet 5 花的钱,比 fable 还多了 6.8。

幸亏配置者手里有 Token 计数用具,能把这层互异精准量出来,这亦然 Willison 此次能在发布当晚就把"遮蔽式加价"摆到桌面上的原因。

换成正常用户,大约率只会在月底账单上隐隐地以为"这个月何如花得有点多",中 A ÷ 的计了。

配置者应怎么接管?

把 Sonnet 5 "明降暗涨"这件事放回到系数行业里看,加价这件事自己这两年并不荒废,果然区别在于走哪条路。

OpenAI 本年 4 月给 GPT-5.5 调价,走的是摆在台面上那条路,平直把每百万输入 / 出 Token 的价钱从 2.5/15 好意思元提到 5/30,整整翻了倍,谁开价钱页王人能看到这个数字变了。

Sonnet 5 走的是另条路,标价那栏个字没动,涨幅藏在分词器换代这层技能细节里,不主动去量就发现不了。

对要把使命流移动到 Sonnet 5 的配置者来说,有件事比记取"价钱表变没变"灵验,即是先拿我方真实的使命负载,用 Token 计数用具实测遍,预估下实质价钱。

毕竟标价表只可告诉你单价,账单才调告诉你此次升到底要花几许钱。

那张被悄悄改写的账单," Opus 平替"其实是同件事的两面。

Sonnet 5 如实用低的价钱换来了接近 Opus 的才略,仅仅此次,"低的价钱"五个字背后,藏着把换了刻度的尺子。

后,还有配置者指出,把视野放大就会发现,并不是只好 Claude 不错接管。

这名配置者发现,天然 Sonnet 在 A ÷ 里面是个价比之选,但智谱 GLM-5.2 的能与 Sonnet 5 出入几。

而价钱,GLM-5.2 的输入价钱只好 Sonnet 5 的七成,输出价钱是连半王人不到。

用这名配置者的话说,何要花多的钱买少的东西呢?

参考承接:

[ 1 ] https://www.anthropic.com/news/claude-sonnet-5

[ 2 ] https://simonwillison.net/2026/Jun/30/claude-sonnet-5/

[ 3 ] https://x.com/theo/status/2072068395529576912

[ 4 ] https://x.com/0xSero/status/2072028529550832068

键三连「点赞」「转发」「贯注心」

接待在批驳区留住你的思法!

—  完  —

� � 点亮星标 � �

科技前沿施展逐日见天津市瑞通预应力钢绞线有限公司相关词条:不锈钢保温施工     塑料管材生产线     钢绞线厂家    玻璃棉板    泡沫板橡塑板专用胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述黄冈钢绞线 矿用,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。

查看更多