国产人妻精品区一区二区三区_色噜噜狠狠一区二区三区果冻_最新国产の精品合集bt7086_av电影手机在线观看_亚洲国产欧美在线综合其他_成免费crm85171_97人妻人人揉人人澡人人爽国产_色天使久久综合网天天_爱回家之开心速递粤语在线观看

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

突發(fā)!Anthropic呼吁全員停止AI研究

0
分享至

Jay 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

重要發(fā)現(xiàn):AI的自進(jìn)化,開始了。

這是Anthropic剛剛在長(zhǎng)文博客中,發(fā)表的暴論。

我們的內(nèi)部數(shù)據(jù)顯示,Claude正在加速AI發(fā)展,這可能是一條遞歸自我提升(RSI)的路徑。



并非「危言聳聽」,看了下文章,Anthropic是真的實(shí)打?qū)嵉赜脭?shù)據(jù)在說話——

截止今年5月,80%以上的Anthropic代碼,都是Claude寫的。

而在Claude Code發(fā)布之前,這個(gè)數(shù)字還僅是個(gè)位數(shù)。

與此同時(shí),Anthropic工程師平均每季度交付的代碼量,是2021-2025年的8倍。



更重要的是質(zhì)量——

在最開放、最模糊、連答案長(zhǎng)什么樣都不確定的編程任務(wù)上,Claude的成功率現(xiàn)在是76%,六個(gè)月前才26%。

50個(gè)百分點(diǎn)的跳升。半年。



Anthropic內(nèi)部已經(jīng)有不少工程師覺得,Claude寫的代碼質(zhì)量和人類打平了。

預(yù)計(jì)年內(nèi)會(huì)超過。

Anthropic還強(qiáng)調(diào),如果這個(gè)趨勢(shì)持續(xù)下去,AI自己設(shè)計(jì)和構(gòu)建下一代AI,是完全可能的。

這可能徹底改變社會(huì),在醫(yī)療、科技、經(jīng)濟(jì)領(lǐng)域帶來巨大的好處。但也可能讓對(duì)齊問題疊加惡化,最終導(dǎo)致失控。

因此,Anthropic帶頭呼吁:

如果存在一個(gè)可驗(yàn)證的機(jī)制,能保證AI實(shí)驗(yàn)室確實(shí)都沒偷偷卷,我們?cè)敢鉁p速、甚至?xí)和!?/strong>

除此之外,Anthropic的這篇博客里,還放出了蠻多有意思的觀點(diǎn)和事實(shí)。

以下是經(jīng)過整理,更方便大家閱讀的版本。

Enjoy。

Anthropic長(zhǎng)文定調(diào)

AI圈的摩爾定律來了

Anthropic創(chuàng)建了個(gè)全新的衡量維度,叫「AI能獨(dú)立完成的任務(wù)時(shí)長(zhǎng)」。

2024年3月,Claude Opus 3能搞定人類大概需要4分鐘的軟件任務(wù)。

一年后,Claude Sonnet 3.7,1.5小時(shí)。

又一年,Claude Opus 4.6,12小時(shí)

而最新的Mythos,在內(nèi)測(cè)中的表現(xiàn)是:

能連續(xù)工作「至少」16小時(shí),已經(jīng)到了METR測(cè)試框架能衡量的上限了。

這個(gè)翻倍速度,從原來的每7個(gè)月翻一倍,加速到了每4個(gè)月翻一倍。

如果趨勢(shì)不變,2027年,可能是好幾周



Claude編寫了大部分Anthropic代碼

截至2026年5月,我Anthropic代碼庫(kù)的代碼,超過80%由Claude編寫。
在Claude Code發(fā)布前,這個(gè)數(shù)字一直只有個(gè)位數(shù)。

這種變化,也體現(xiàn)在工程師的工作方式上。

在 Anthropic 的最初四年,工程師每天Merge的代碼行數(shù)基本保持不變。

2025年, Claude開始自己寫代碼,merge數(shù)突然開始飆升。

如今,2026年第二季度,工程師每天merge的代碼量是2024年的8倍



不過,代碼量上去了,代碼質(zhì)量是不是注水了?

Anthropic說,這一年來,工程師糾正Claude的次數(shù),越來越少了。

這一點(diǎn),在benchmark中可見一斑,如下圖所示。

所有難度類型的任務(wù)中,Claude的成功率,無一例外的一路暴增。



所以,Anthropic現(xiàn)在干脆用Claude來review代碼。

是的,所有提交到代碼庫(kù)的改動(dòng),都會(huì)先過一遍Claude自動(dòng)審查,檢查bug、安全漏洞和其他缺陷。

他們回溯分析發(fā)現(xiàn),如果之前每次改動(dòng)都有這道自動(dòng)審查,大約三分之一導(dǎo)致claude.ai線上事故的bug,上線之前就會(huì)被攔下來。

要知道,寫那些代碼的工程師,已經(jīng)是全世界造AI系統(tǒng)最頂尖的一批人了。

Claude在抓他們的錯(cuò)誤。

創(chuàng)造力的放大鏡

接下來是Claude在研究層面的參與程度。

Anthropic有個(gè)慣例,每次發(fā)新模型,都會(huì)給Claude一段訓(xùn)練小型AI模型的代碼,讓它在保證正確性的前提下,把運(yùn)行速度優(yōu)化到最快。

2025年5月,Claude Opus 4交出的答案是:加速3倍。

2026年4月,Claude Mythos Preview做到了52倍。

作為參考,一個(gè)熟練的人類研究員,需要4到8個(gè)小時(shí)才能勉強(qiáng)達(dá)到4倍。

不到一年的時(shí)間,Claude超過了人類。

2026年4月,Anthropic丟給Claude一個(gè)AI安全研究,大意是「一個(gè)弱模型能不能可靠地監(jiān)督一個(gè)強(qiáng)模型」,然后讓Claude自己提假設(shè)、跑實(shí)驗(yàn)……

這次先說人類的表現(xiàn)吧,兩個(gè)人類研究員花了大約一周時(shí)間,把gap縮小了23%。

而Claude,在大約800小時(shí)、花了大約18000美元的算力之后——

縮小了97%。



我們何去何從?

到這里為止,結(jié)論已經(jīng)很清楚了。

人類在AI開發(fā)流程里的角色,每一個(gè)環(huán)節(jié)都在收窄。

代碼,Claude寫了。代碼review,Claude做了。實(shí)驗(yàn)執(zhí)行,Claude快了人類一個(gè)數(shù)量級(jí)。實(shí)驗(yàn)設(shè)計(jì),Claude開始自己來了……

人類現(xiàn)在最后的比較優(yōu)勢(shì),是研究品味和判斷力。

但這個(gè)優(yōu)勢(shì)能守多久?

Anthropic在博客里說,他們也不確定。

一種可能是,「研究品味」就像之前AI不會(huì)的其他東西一樣,先是做不到,然后突然就做到了。

就像AI理解幽默、展示心智理論、解語言謎題,都經(jīng)歷了同樣的曲線。

另一種可能是,即便Claude永遠(yuǎn)學(xué)不會(huì)真正的研究品味,僅靠現(xiàn)在的加速趨勢(shì),每個(gè)人類研究員能同時(shí)指揮的工作量已經(jīng)大了好幾倍。

你不需要AI完全替代你思考,它只要把所有「執(zhí)行」的活全干了,你就只需要做那5%的方向選擇。



RSI的三種未來

博客結(jié)尾,Anthropic描繪了關(guān)于這次「自進(jìn)化」趨勢(shì)三個(gè)可能演化方向。

1、停滯。

那些指數(shù)曲線其實(shí)是S曲線。

也許研究判斷力這個(gè)東西就是沒法靠scale解決,需要一種全新的架構(gòu)突破。

或者,瓶頸在能源、在芯片、在算力的物理供應(yīng)鏈上。

不過,即便AI的能力就停滯在今天的水平,也會(huì)發(fā)生對(duì)世界帶來重大變化。

前段時(shí)間的Project Glasswing,Mythos Preview在上線頭幾周就發(fā)現(xiàn)了超過一萬個(gè)高危和嚴(yán)重級(jí)別的軟件漏洞,遍布全球最關(guān)鍵的系統(tǒng)。

2、AI持續(xù)加速,但人類仍然把著方向盤。

組織效率會(huì)指數(shù)級(jí)提升,100人的公司做1萬甚至10萬人的活。知

Anthropic覺得我們大概率正在走進(jìn)這個(gè)場(chǎng)景。

但他們也發(fā)現(xiàn)了一個(gè)有意思的現(xiàn)象,就是阿姆達(dá)爾定律在組織里的體現(xiàn)_

Claude把代碼寫得飛快了,結(jié)果代碼review變成了新瓶頸。各種新想法、新工具、新實(shí)驗(yàn)爆炸式涌現(xiàn),遠(yuǎn)超組織的消化能力。

瓶頸不會(huì)消失,只是轉(zhuǎn)移到下一個(gè)環(huán)節(jié)。

3、AI實(shí)現(xiàn)完全的遞歸自我提升,開始自己造下一代自己。

這個(gè)場(chǎng)景下,AI的發(fā)展速度完全取決于算力了。人類退到監(jiān)督、驗(yàn)證、審核的位置。

如果真的發(fā)生,這種能力大概率會(huì)遷移到其他科學(xué)領(lǐng)域,醫(yī)學(xué)、材料、能源,全線起飛。

當(dāng)然,另一種未來,是對(duì)齊失敗。

這種情況下,偏差會(huì)在AI自我迭代的過程中逐步累積,最終——完全失控。

OMT

以上,便是Anthropic此次關(guān)于自進(jìn)化,最關(guān)鍵的幾個(gè)觀點(diǎn)。

說實(shí)話,最開始我其實(shí)沒太當(dāng)回事,畢竟Anthropic馬上就要IPO了,這一波不是典型的「Anthropic式」公關(guān)?

你別說,這次,可能真的有點(diǎn)不一樣。

因?yàn)榫驮趲滋烨埃?strong>OpenAI也發(fā)布了類似的博客:

我們也在當(dāng)今系統(tǒng)中看到自進(jìn)化的早期跡象: AI的發(fā)展本身也被AI加速。
我們預(yù)計(jì)這將加劇開發(fā)商和國(guó)家之間的競(jìng)爭(zhēng)壓力,并帶來現(xiàn)有機(jī)構(gòu)無法應(yīng)對(duì)的治理挑戰(zhàn)。
隨著RSI的出現(xiàn),社會(huì)需要方法塑造AI的發(fā)展軌跡 ,確保其服務(wù)于人類利益。



奇點(diǎn),似乎來得比所有人預(yù)想的都要快。

博客:https://www.anthropic.com/institute/recursive-self-improvement

參考鏈接:
[1]https://x.com/kimmonismus/status/2062517474277675102
[2]https://x.com/anthropicai/status/2062568873321513443

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
北京“退衣姐”被刑拘!換賬號(hào)調(diào)包退貨她干了4年|大象夜讀

北京“退衣姐”被刑拘!換賬號(hào)調(diào)包退貨她干了4年|大象夜讀

大象新聞
2026-06-16 19:23:35
“購(gòu)車后一個(gè)星期就發(fā)現(xiàn)空調(diào)噴白色粉末”,速騰“噴粉”波及寶來!一汽-大眾稱顆粒無害、免費(fèi)換空調(diào)蒸發(fā)器,多位車主陷“拆修”兩難

“購(gòu)車后一個(gè)星期就發(fā)現(xiàn)空調(diào)噴白色粉末”,速騰“噴粉”波及寶來!一汽-大眾稱顆粒無害、免費(fèi)換空調(diào)蒸發(fā)器,多位車主陷“拆修”兩難

每日經(jīng)濟(jì)新聞
2026-06-16 21:40:50
尷尬!巴西男球迷看臺(tái)上緊盯女伴胸部看 被轉(zhuǎn)播鏡頭拍到后生無可戀

尷尬!巴西男球迷看臺(tái)上緊盯女伴胸部看 被轉(zhuǎn)播鏡頭拍到后生無可戀

風(fēng)過鄉(xiāng)
2026-06-16 13:11:30
山東3億北斗工程現(xiàn)“脆皮底座”,官方組成聯(lián)合調(diào)查組

山東3億北斗工程現(xiàn)“脆皮底座”,官方組成聯(lián)合調(diào)查組

界面新聞
2026-06-17 08:03:46
必勝客,被賣了

必勝客,被賣了

澎湃新聞
2026-06-16 23:59:03
特朗普直言不想為臺(tái)海開戰(zhàn),國(guó)會(huì)立馬立法鎖死對(duì)臺(tái)強(qiáng)硬路線

特朗普直言不想為臺(tái)海開戰(zhàn),國(guó)會(huì)立馬立法鎖死對(duì)臺(tái)強(qiáng)硬路線

健身狂人
2026-06-16 20:29:01
五月的消費(fèi)數(shù)據(jù)爆了

五月的消費(fèi)數(shù)據(jù)爆了

大何日拱一卒
2026-06-16 18:33:13
76歲上海阿婆被星探邀約做代言人,還差點(diǎn)參加春晚彩排?警方緊急攔停3次!

76歲上海阿婆被星探邀約做代言人,還差點(diǎn)參加春晚彩排?警方緊急攔停3次!

新民晚報(bào)
2026-06-16 10:49:59
給伊朗的3000億賠款,特朗普一分不出,要讓叫最歡的海灣國(guó)家買單

給伊朗的3000億賠款,特朗普一分不出,要讓叫最歡的海灣國(guó)家買單

共工之錨
2026-06-17 00:31:30
日本國(guó)腳竟是輪奸犯?主教練曾回應(yīng):只是失誤!此前多名日本前國(guó)腳陷入性侵丑聞

日本國(guó)腳竟是輪奸犯?主教練曾回應(yīng):只是失誤!此前多名日本前國(guó)腳陷入性侵丑聞

新民周刊
2026-06-16 15:05:47
高校,瘋狂擴(kuò)招了

高校,瘋狂擴(kuò)招了

城市財(cái)經(jīng)
2026-06-15 11:45:40
這個(gè)小女孩火了!大聲吐槽雷軍:吃早飯還要拍照,評(píng)論區(qū)替她擔(dān)心

這個(gè)小女孩火了!大聲吐槽雷軍:吃早飯還要拍照,評(píng)論區(qū)替她擔(dān)心

譚談社會(huì)
2026-06-16 19:46:45
寶媽誤發(fā)私密視頻風(fēng)波未停:最該譴責(zé)的,從來不是失手的當(dāng)事人

寶媽誤發(fā)私密視頻風(fēng)波未停:最該譴責(zé)的,從來不是失手的當(dāng)事人

千言娛樂記
2026-06-15 16:54:12
雷軍被罵東施效顰!都是在街邊,都是吃面,遭嘲諷模仿黃仁勛翻車

雷軍被罵東施效顰!都是在街邊,都是吃面,遭嘲諷模仿黃仁勛翻車

譚談社會(huì)
2026-06-16 18:34:43
樂山一事業(yè)單位招考2名臨聘人員進(jìn)面試,崗位被質(zhì)疑為“蘿卜崗”,涉事單位否認(rèn)

樂山一事業(yè)單位招考2名臨聘人員進(jìn)面試,崗位被質(zhì)疑為“蘿卜崗”,涉事單位否認(rèn)

瀟湘晨報(bào)
2026-06-16 21:11:02
山東一村莊老齡化率近50%!老兩口月收入僅436元,全靠2元集體食堂存活

山東一村莊老齡化率近50%!老兩口月收入僅436元,全靠2元集體食堂存活

風(fēng)向觀察
2026-06-16 09:09:46
4.6萬婚宴上預(yù)制菜后續(xù):黑料被扒,新郎身份曝光,踢到鐵板了

4.6萬婚宴上預(yù)制菜后續(xù):黑料被扒,新郎身份曝光,踢到鐵板了

阿纂看事
2026-06-16 18:41:03
拿清華全額獎(jiǎng)學(xué)金留學(xué),印度女學(xué)生回國(guó)瘋狂吐槽:中國(guó)是封閉社會(huì)

拿清華全額獎(jiǎng)學(xué)金留學(xué),印度女學(xué)生回國(guó)瘋狂吐槽:中國(guó)是封閉社會(huì)

小徐講八卦
2026-06-16 14:59:41
世界杯神助攻!24歲巨星加冕MVP:1腳穿透4人 姆巴佩感謝他

世界杯神助攻!24歲巨星加冕MVP:1腳穿透4人 姆巴佩感謝他

葉青足球世界
2026-06-17 06:54:26
伊朗戰(zhàn)爭(zhēng)是美國(guó)最重大的戰(zhàn)略失誤之一,特朗普戰(zhàn)前宣布的5個(gè)目標(biāo)全部失敗

伊朗戰(zhàn)爭(zhēng)是美國(guó)最重大的戰(zhàn)略失誤之一,特朗普戰(zhàn)前宣布的5個(gè)目標(biāo)全部失敗

互聯(lián)網(wǎng)大觀
2026-06-16 10:35:36
2026-06-17 08:40:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12798文章數(shù) 176499關(guān)注度
往期回顧 全部

科技要聞

美國(guó)給Anthropic新模型上了“芯片級(jí)管制”

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀(jì)錄破了個(gè)遍

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀(jì)錄破了個(gè)遍

體育要聞

身價(jià)5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個(gè)女兒在靈堂內(nèi)茫然失措

財(cái)經(jīng)要聞

美媒曝光美伊諒解備忘錄草案完整版

汽車要聞

三車齊發(fā) 零跑全新C10/C11/C16上市12.58萬元起

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
本地
親子
房產(chǎn)

藝術(shù)要聞

懷素臨終絕筆,草書巔峰作:《四十二章經(jīng)》

夏天最好看的6只包!照著搭美出新高度

本地新聞

這屆年輕人為什么都在找心流時(shí)刻?

親子要聞

1歲前多做這項(xiàng)運(yùn)動(dòng),孩子上學(xué)后聽課專心、寫字端正,家長(zhǎng)太省心

房產(chǎn)要聞

最新房?jī)r(jià):???、三亞;新房、二手房全線下跌!

無障礙瀏覽 進(jìn)入關(guān)懷版