国产人妻精品区一区二区三区_色噜噜狠狠一区二区三区果冻_最新国产の精品合集bt7086_av电影手机在线观看_亚洲国产欧美在线综合其他_成免费crm85171_97人妻人人揉人人澡人人爽国产_色天使久久综合网天天_爱回家之开心速递粤语在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude Fable 5省錢秘訣來了:調(diào)成Low檔比Opus更便宜

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

聰明人總能花最少的錢辦最好的事,AI也一樣。

就在大伙還在為Claude Fable 5兩倍于Opus 4.8的token單價(jià)發(fā)愁時(shí),反轉(zhuǎn)來了——

不少開發(fā)者發(fā)現(xiàn),把Fable 5的努力程度(effort)調(diào)到最低的low檔之后,模型不僅沒變?nèi)?,反而變得格外能打,token消耗也著實(shí)少了。



而且哪怕是最低檔位,它在SWE-bench Pro上的得分依然壓過Opus 4.8開到最強(qiáng)xhigh檔的成績——75.0對68.6。



(注:系統(tǒng)卡這組數(shù)據(jù)出自Mythos 5配置。Fable 5是加了安全分類器的公開版本,兩者權(quán)重相同,編碼任務(wù)基本不觸發(fā)分類器)

不過,開low檔省錢用好模型還只是故事的一半。

因?yàn)檫^去一天里,不少人發(fā)現(xiàn),F(xiàn)able 5的省錢未必只是因?yàn)殚_了low檔。

在一些實(shí)際任務(wù)中,它甚至能做到效果更好、速度更快,最后賬單還更便宜。



比如在GameBench的測試?yán)铮鎸ν粋€(gè)蜘蛛吃蟲子的小游戲任務(wù),F(xiàn)able 5不僅生成速度更快,效果也更好,而最終成本反而低于Opus 4.8。

(左邊為Fable 5,右邊為Opus 4.8)

這下。事情就有意思了。

原本大家還在糾結(jié)Fable 5貴了一倍,現(xiàn)在卻發(fā)現(xiàn),它不僅更強(qiáng),很多時(shí)候甚至還更省。

貴是貴在單價(jià)上,省卻省在最后的賬單上,F(xiàn)able5 low啟動!



貴的模型怎么更省錢

那么,為啥明明更貴的模型反而更省錢呢?

畢竟,F(xiàn)able定價(jià)每百萬輸入token 10美元、輸出50美元,剛好是上一代旗艦Opus 4.8(5美元/25美元)的兩倍。



對此,Claude Code之父Boris Cherny在Threads上解釋了這筆賬:

Fable每token的價(jià)格確實(shí)是Opus的兩倍,但完成同一個(gè)任務(wù)平均用的token更少,因?yàn)樗斆?、更高效,在一些?fù)雜任務(wù)上,F(xiàn)able的實(shí)際花費(fèi)反而低于Opus。



評論區(qū)也有網(wǎng)友表達(dá)了類似觀點(diǎn):

目前觀察到的就是這樣,單任務(wù)token更少,糾錯(cuò)動作更少,浪費(fèi)的token也就更少。



換句話說,以前那些不夠聰明的Agent,總會在寫錯(cuò)了再改、跑掛了重跑的過程中瘋狂燒token。

模型越笨,犯錯(cuò)次數(shù)越多,你就得多付一輪token的錢。

而Fable 5砍掉的,恰恰就是這部分隱性成本。

比如,F(xiàn)able 5在shortcut的電子表格任務(wù)測試中,F(xiàn)able 5在所有effort檔位都跑贏了Opus 4.8,不僅回合數(shù)更少,整體完成速度還快了25%~30%。



再比如物理研究那條案例。

署名為Matthew Pines(CEO)的研究者表示,F(xiàn)able 5是他們測過最強(qiáng)的前沿物理研究模型,僅用三分之一的推理token,就在36小時(shí)內(nèi)跑到了GPT-5.5需要四天才能接近的位置。



當(dāng)然,F(xiàn)able比Opus更省更好也不是絕對的,具體還得看任務(wù)類型。

Reddit上也有網(wǎng)友反饋,在某些特定任務(wù)里,F(xiàn)able確實(shí)會消耗更多token,但并沒有外界想象得那么夸張,很大程度上取決于上下文長度和任務(wù)規(guī)模。

如果任務(wù)本身不復(fù)雜,其他effort檔位甚至其他模型,也完全夠用。



其實(shí)官方公告里也悄悄提到了這一點(diǎn)。



Anthropic在發(fā)布文章中提到,F(xiàn)able 5相比以往Claude模型擁有更高的token效率。

他們給出的證據(jù)來自Cognition的FrontierCode評測。這套評測考察的是模型能否在達(dá)到生產(chǎn)級代碼標(biāo)準(zhǔn)的前提下完成高難度任務(wù),而Fable 5僅在medium檔位,就已經(jīng)拿下了所有前沿模型中的第一名。



所以,這套定價(jià)的正確打開方式或許不是看每token多少錢,而是看每干完一個(gè)活多少錢。

按前者算,F(xiàn)able 5確實(shí)貴了一倍。

但按后者算,在足夠復(fù)雜的任務(wù)上,它甚至可能比Opus還便宜。

不僅省,榜單這一塊也被Fable 5掃完了

如果說更低的任務(wù)成本還屬于見仁見智,那么過去一天多時(shí)間里各家評測榜單給出的結(jié)果就比較直接了:

Fable 5幾乎把能拿的第一都拿了一遍。

先看綜合能力。

在Artificial Analysis最新的智能指數(shù)中,F(xiàn)able 5以64.9分排名第一,領(lǐng)先GPT-5.5約5分,榜單前兩名全部被Anthropic包攬。



在人類最后的測試(Humanity’s Last Exam)上,F(xiàn)able 5拿到53%的成績,比第二名高出7個(gè)百分點(diǎn)以上。



再看Agent能力。

在arena.ai的Agent榜單上,F(xiàn)able 5登頂榜首。



文本處理、網(wǎng)頁開發(fā)等場景依舊保持領(lǐng)先。



在FrontierCode上也是第一。



SimpleBench上的表現(xiàn)則已經(jīng)逼近人類水平。



除此之外,編程能力可能是爭議最小的一項(xiàng)。

拋開Anthropic自己的數(shù)據(jù)之外,第三方評測機(jī)構(gòu)TrueFoundry公布的結(jié)果顯示,在SWE-Bench Pro上,F(xiàn)able 5以80.3%的成績拿到所有受測模型中的最高分,GPT-5.5在這一項(xiàng)上落后超過21個(gè)百分點(diǎn)。



Every的評測文章則給出了一個(gè)更直觀的數(shù)字。

在他們最難的Senior Engineer基準(zhǔn)測試中,F(xiàn)able 5獲得91分(滿分100分),已經(jīng)接近參與測試的人類資深工程師水平區(qū)間;作為對比,Opus 4.8得63分,GPT-5.5得62分。

One more thing

不過,在把Fable 5默認(rèn)調(diào)成low檔之前,還有兩件事值得注意。

第一,F(xiàn)able 5帶著安全分類器上線。

涉及網(wǎng)絡(luò)安全、生物化學(xué)、模型蒸餾等敏感請求時(shí),系統(tǒng)會自動切換到Opus 4.8回答,并按照Opus價(jià)格計(jì)費(fèi)。Anthropic表示,這類情況觸發(fā)率不到5%的會話。

這也意味著,部分安全相關(guān)Benchmark上的成績,公開版本未必能夠完全復(fù)現(xiàn)。

第二,當(dāng)前的免費(fèi)使用窗口是限時(shí)的。

6月22日之前,Pro、Max、Team以及按席位計(jì)費(fèi)的企業(yè)版用戶都可以直接使用Fable 5;從6月23日起,將開始消耗用量積分。Anthropic表示,等算力容量跟上之后,會重新恢復(fù)為訂閱權(quán)益。

另外,使用Fable 5需要開啟30天數(shù)據(jù)保留,以滿足安全監(jiān)控要求。


[1]https://game-bench.piccini.app/
[2]https://www.threads.com/@boris_cherny/post/DZYShwtkiJS/fable-is-x-as-expensive-as-opus-per-token-but-uses-less-tokens-on-average-to-do/
[3]https://arena.ai/leaderboard

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“好好的孩子,毀你倆手了!”夫妻倆不接老師電話,錯(cuò)過中考繳費(fèi)

“好好的孩子,毀你倆手了!”夫妻倆不接老師電話,錯(cuò)過中考繳費(fèi)

林林先生
2026-06-15 10:08:40
中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達(dá)44%。

中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達(dá)44%。

流蘇晚晴
2026-06-13 18:21:18
佘詩曼生日飯局古天樂現(xiàn)身,大合照企埋一邊依然咁搶眼

佘詩曼生日飯局古天樂現(xiàn)身,大合照企埋一邊依然咁搶眼

粵睇先生
2026-06-16 23:56:33
選中國,還是選日本?G7成員國亮出最新政策,高市早苗被釜底抽薪

選中國,還是選日本?G7成員國亮出最新政策,高市早苗被釜底抽薪

影孖看世界
2026-06-16 20:28:50
德國緊隨韓國之后,也發(fā)布了“中文標(biāo)語”,引起了中國游客的不滿

德國緊隨韓國之后,也發(fā)布了“中文標(biāo)語”,引起了中國游客的不滿

溫讀史
2026-04-03 09:46:40
央企“最牛女副處長”落馬:兩年與上司開房410次,細(xì)節(jié)曝光

央企“最牛女副處長”落馬:兩年與上司開房410次,細(xì)節(jié)曝光

西門老爹
2025-12-16 15:35:31
金價(jià)6月17日,大家要擦亮雙眼了,明后兩天,金價(jià)或?qū)⒅噩F(xiàn)歷史了

金價(jià)6月17日,大家要擦亮雙眼了,明后兩天,金價(jià)或?qū)⒅噩F(xiàn)歷史了

趣味萌寵的日常
2026-06-17 05:00:09
廣州一樓盤銷售,騙走購房款,幾十人上當(dāng)!地產(chǎn)公司:已報(bào)案

廣州一樓盤銷售,騙走購房款,幾十人上當(dāng)!地產(chǎn)公司:已報(bào)案

靚仔情感
2026-06-17 04:10:46
被員工在自家直播間爆料!老牌國貨創(chuàng)始人:已報(bào)警!很多深圳人買過

被員工在自家直播間爆料!老牌國貨創(chuàng)始人:已報(bào)警!很多深圳人買過

南方都市報(bào)
2026-06-16 19:52:55
楊天真曝經(jīng)紀(jì)人簽1000萬告訴藝人500萬,很多藝人知道但是沒辦法

楊天真曝經(jīng)紀(jì)人簽1000萬告訴藝人500萬,很多藝人知道但是沒辦法

韓小娛
2026-06-17 08:03:44
李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

娛樂團(tuán)長
2026-06-02 15:09:12
《年會不能停2》劇組上影節(jié)走紅毯,演員高葉兩次欲言又止,堅(jiān)持讓張若昀、白客先發(fā)言,與片方演員表排序保持一致

《年會不能停2》劇組上影節(jié)走紅毯,演員高葉兩次欲言又止,堅(jiān)持讓張若昀、白客先發(fā)言,與片方演員表排序保持一致

極目新聞
2026-06-14 20:06:31
賴清德剛對大陸下戰(zhàn)書,兩岸就在廈門簽約,鄭麗文終于等來機(jī)會

賴清德剛對大陸下戰(zhàn)書,兩岸就在廈門簽約,鄭麗文終于等來機(jī)會

小影的娛樂
2026-06-16 17:05:04
他是大家熟悉的演員,娶小27歲央視主持人,快60歲才老來得女

他是大家熟悉的演員,娶小27歲央視主持人,快60歲才老來得女

史行途
2026-06-16 20:21:05
局勢已惡化,菲律賓全方位反華,連開3槍逼中國認(rèn)栽,中沒有退路

局勢已惡化,菲律賓全方位反華,連開3槍逼中國認(rèn)栽,中沒有退路

快看張同學(xué)
2026-06-16 19:36:35
莫言:如果你混到?jīng)]人找你吃飯,沒人喊你聚會,連電話也沒幾個(gè),那慶祝了,你不是人緣變差,而是真正覺醒了

莫言:如果你混到?jīng)]人找你吃飯,沒人喊你聚會,連電話也沒幾個(gè),那慶祝了,你不是人緣變差,而是真正覺醒了

品讀時(shí)刻
2026-05-27 09:00:58
震驚!女子得知被拒相親男娶“潮汕A9家庭”妻子,控訴他隱瞞家底

震驚!女子得知被拒相親男娶“潮汕A9家庭”妻子,控訴他隱瞞家底

火山詩話
2026-06-14 12:48:44
纖細(xì)身形 + 瑜伽褲穿搭文案|瘦小女生穿出別致線條美感

纖細(xì)身形 + 瑜伽褲穿搭文案|瘦小女生穿出別致線條美感

只要高興就好
2026-06-03 11:46:20
奧運(yùn)冠軍“拉拉鏈露胸”,讓耐克繃不住了!

奧運(yùn)冠軍“拉拉鏈露胸”,讓耐克繃不住了!

品牌營銷報(bào)
2026-02-23 11:31:10
吉林女子控訴前夫不給孩子生活費(fèi),只能吃泡面,轉(zhuǎn)頭曬海景房自拍

吉林女子控訴前夫不給孩子生活費(fèi),只能吃泡面,轉(zhuǎn)頭曬海景房自拍

搗蛋窩
2026-06-15 07:31:15
2026-06-17 08:43:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12798文章數(shù) 176499關(guān)注度
往期回顧 全部

科技要聞

美國給Anthropic新模型上了“芯片級管制”

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀(jì)錄破了個(gè)遍

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀(jì)錄破了個(gè)遍

體育要聞

身價(jià)5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個(gè)女兒在靈堂內(nèi)茫然失措

財(cái)經(jīng)要聞

美媒曝光美伊諒解備忘錄草案完整版

汽車要聞

三車齊發(fā) 零跑全新C10/C11/C16上市12.58萬元起

態(tài)度原創(chuàng)

旅游
藝術(shù)
教育
時(shí)尚
本地

旅游要聞

章丘公園的荷花盛開

藝術(shù)要聞

懷素臨終絕筆,草書巔峰作:《四十二章經(jīng)》

教育要聞

高考正是展示女子新字的好機(jī)會!忮賢忌能這種“好詞”只用在游戲

夏天最好看的6只包!照著搭美出新高度

本地新聞

這屆年輕人為什么都在找心流時(shí)刻?

無障礙瀏覽 進(jìn)入關(guān)懷版