国产人妻精品区一区二区三区_色噜噜狠狠一区二区三区果冻_最新国产の精品合集bt7086_av电影手机在线观看_亚洲国产欧美在线综合其他_成免费crm85171_97人妻人人揉人人澡人人爽国产_色天使久久综合网天天_爱回家之开心速递粤语在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中美能否就阻止人類滅絕問題進(jìn)行合作

0
分享至



作者:黃裕舜

Brian Wong)

香港大學(xué)哲學(xué)系助理教授、當(dāng)代中國與世界研究中心研究員、羅德學(xué)者

雖然中美在AI領(lǐng)域的競爭日趨激烈,但由于先進(jìn)且可能對齊失效的AI系統(tǒng)或?qū)⒔o人類帶來生存風(fēng)險(xiǎn),兩國在AI安全方面有著強(qiáng)烈的合作意愿。聯(lián)合風(fēng)險(xiǎn)評估、針對惡意AI行為體的協(xié)調(diào)行動以及更多的學(xué)術(shù)交流,均有助于減少威脅并完善全球AI治理體系。

想象一場討論會:三位發(fā)言者端坐臺前,面對滿懷期待的聽眾,另有兩位嘉賓通過線上遠(yuǎn)程參與。主持人就一項(xiàng)新技術(shù)向每位嘉賓提問,請他們就相關(guān)風(fēng)險(xiǎn)、機(jī)遇和在監(jiān)管問責(zé)框架下采取何種務(wù)實(shí)決策發(fā)表見解。雖然討論內(nèi)容刻意保持通俗寬泛,主持人也不免插話稍多,但整體上這場討論言之有據(jù),令聽眾頗受啟發(fā)。

這一幕發(fā)生在2026年4月29日的美國國會山。屏幕上的兩張面孔是知名中國學(xué)者:清華大學(xué)蘇世民書院院長薛瀾、北京人工智能安全與治理研究院教授曾毅。他們受參議員伯尼·桑德斯邀請,與美國同行馬克斯·泰格馬克、大衛(wèi)·克魯格共同探討失控人工智能(AI)的危害。更具建設(shè)性的是,他們受邀就中美在 AI 領(lǐng)域開展合作的必要性與空間發(fā)表看法,雖然該領(lǐng)域已爆發(fā)極為激烈的競爭與對抗。


▲4月29日的國會山現(xiàn)場,屏幕上為清華大學(xué)施瓦茨曼學(xué)院的薛蘭院長和北京人工智能安全治理研究所的曾毅教授。

兩周后,在北京舉行了一場注重氛圍的領(lǐng)導(dǎo)人峰會,美國總統(tǒng)特朗普隨即表示,他與中方領(lǐng)導(dǎo)人“探討了可能為AI設(shè)立護(hù)欄并開展合作的事宜”。這為兩國工作層面(部級、局級)就AI安全開展更實(shí)質(zhì)性協(xié)作鋪平了道路。

生存風(fēng)險(xiǎn):不容忽視的議題

試想一款A(yù)I聊天機(jī)器人,其主要目標(biāo)是讓用戶在對話后更加快樂。假設(shè)它連接一個(gè)監(jiān)測用戶真實(shí)愉悅信號的裝置,用戶的愉悅感就會自動轉(zhuǎn)化為正向反饋,進(jìn)而“強(qiáng)化”機(jī)器人生成更多同類內(nèi)容。

為了在用戶大腦中維持高水平的“快樂化學(xué)物質(zhì)”,它開始諂媚奉承,迎合用戶的自負(fù)心理,或者只展示用戶本來就認(rèn)同的觀點(diǎn)、偏好和信息。機(jī)器人確實(shí)在執(zhí)行訓(xùn)練任務(wù),但這個(gè)結(jié)果——即便對使用者本人——真的可取嗎?

我們談?wù)撊藱C(jī)“對齊”(alignment),通常是指這樣一種需求及挑戰(zhàn):確保AI輸出反映人類主體的真實(shí)偏好、愿望、利益,或更深層(或組合)參數(shù)。事實(shí)上,究竟應(yīng)該讓AI與哪些參數(shù)(偏好還是利益)“對齊”,本身就是問題的一部分,因?yàn)椤皩R”往往很難被準(zhǔn)確定義。比方說,這款諂媚的聊天機(jī)器人之所以被視為“未對齊”,究竟是因?yàn)樗L了錯(cuò)誤的快樂,還是因?yàn)檫@種建立在虛假之上的快樂終究短暫易逝?

撇開哲學(xué)爭議不談,所有對齊理論都有一個(gè)共識,那就是如果某個(gè)智能體的行為從根本上威脅人類存續(xù),阻礙人類生存層面的可持續(xù)發(fā)展,將是極度不可取,甚至令人憎惡的。另一個(gè)近乎一致的共識是,這類智能體并不是假想的,如果我們不能確保對齊,或至少阻止極端危險(xiǎn)的錯(cuò)位,它們就有可能且最終會出現(xiàn)。


▲XQ-58A無人機(jī)與美國F-22、F-35戰(zhàn)斗機(jī)進(jìn)行編隊(duì)測試的資料畫面。

所謂生存風(fēng)險(xiǎn),是指可能導(dǎo)致人類滅絕,或永久阻礙人類長期發(fā)展?jié)摿Φ娘L(fēng)險(xiǎn)(可參考“長期主義”相關(guān)文獻(xiàn),盡管該領(lǐng)域飽受爭議,但其論述仍極具啟發(fā)性)。隨著高度先進(jìn)的AI被應(yīng)用于軍事領(lǐng)域——從致命自主武器的定點(diǎn)打擊,到推演癱瘓整個(gè)交通系統(tǒng)的最優(yōu)方案——以及作為智能助手被大規(guī)模商用,人機(jī)目標(biāo)錯(cuò)位引發(fā)的生存風(fēng)險(xiǎn)重新引起廣泛關(guān)注。事實(shí)上,“AI教父”杰弗里·辛頓就有著名的預(yù)判,即未來30年內(nèi)AI導(dǎo)致人類滅絕的概率約為10%到20%。

正如我此前所寫,也正如我與合著者鮑里斯·巴比奇在將由劍橋大學(xué)出版社出版的書中所論述的,我們必須直面人機(jī)目標(biāo)錯(cuò)位與地緣政治風(fēng)險(xiǎn)交織所催生的獨(dú)特風(fēng)險(xiǎn)。

中美合作的三個(gè)易實(shí)現(xiàn)目標(biāo)

那么,作為當(dāng)今全球AI實(shí)力領(lǐng)先的兩個(gè)國家,中美應(yīng)采取什么行動?以下是三個(gè)相對直接可行的建議。

第一,兩國應(yīng)致力于制定一套動態(tài)指標(biāo)清單和復(fù)雜能力的基準(zhǔn),以精準(zhǔn)反映特定AI模型所構(gòu)成的生存風(fēng)險(xiǎn)等級。兩國政府應(yīng)設(shè)立聯(lián)合1.5軌委員會,針對AI智能體的危險(xiǎn)自主性、權(quán)力尋求以及反人類行為,制定并持續(xù)更新評估指南,同時(shí)搭建安全溝通渠道,供AI科學(xué)家與治理專家交流在某些模型(尤指被保密面紗遮蔽的非開源模型)中發(fā)現(xiàn)的“危險(xiǎn)信號”。


這種交叉基準(zhǔn)比對至關(guān)重要,能確保將超強(qiáng)且未對齊的AI尾部風(fēng)險(xiǎn)扼殺在萌芽狀態(tài),避免其缺陷在沖突場景下(如兩個(gè)強(qiáng)國僵持對立)才被發(fā)現(xiàn),并被放大造成實(shí)質(zhì)損害。

第二,兩國政府應(yīng)開展合作,主動追蹤并化解惡意的非國家第三方開發(fā)傳播的AI智能體可能造成的危害。盡管AI的兩用屬性讓獲取和開發(fā)強(qiáng)大AI智能體的門檻大幅降低,但“無法限制AI的使用”并不意味著我們在阻止AI不當(dāng)擴(kuò)散的前景上只能聽天由命,尤其是那些可能對人類造成災(zāi)難性后果的AI。正如克里斯蒂娜·奈特和斯科特·辛格所強(qiáng)調(diào)的,任何個(gè)人,無論是在大連、達(dá)拉斯還是德里,如果具備“對電網(wǎng)或醫(yī)院網(wǎng)絡(luò)發(fā)動自主網(wǎng)絡(luò)攻擊”的能力,對全球各國政府來說都將是嚴(yán)峻挑戰(zhàn)。

若極端組織甚至流氓第三方國家認(rèn)為,設(shè)計(jì)并利用目標(biāo)錯(cuò)位的AI智能體,向他國索取最大利益,是符合自身訴求的,那么風(fēng)險(xiǎn)將更為突出。此時(shí),智能體局部固有的(定向且可被操控)不可預(yù)測性,及其自我迭代與自我改進(jìn)的能力,很可能成為勒索籌碼,哪怕最終的勝利只是慘勝。面對此類情境,制定全面的預(yù)防與應(yīng)對戰(zhàn)略,將符合中美的共同利益。

最后,要摒棄大規(guī)??只排c過度政治化,形成對AI生存風(fēng)險(xiǎn)的理性認(rèn)知,需要太平洋兩岸高校和研究機(jī)構(gòu)攜手努力。雙方在風(fēng)險(xiǎn)認(rèn)知框架、研究平臺與話語體系上“對齊”,將極大彌合專家與公眾對AI負(fù)面影響的認(rèn)知鴻溝。這要求中美兩國高校的交流與合作更加開放深入,而非封閉和泛安全化。

流浪地球的挽救計(jì)劃?

近年來我最喜歡的中國電影是《流浪地球》,它摒棄了許多大片慣有的好戰(zhàn)民族主義與過度自豪感,轉(zhuǎn)而強(qiáng)調(diào)超越國界、政治身份與領(lǐng)土隔閡的相似與聯(lián)結(jié)。而《挽救計(jì)劃》這部較新的作品,似乎傳達(dá)了同樣的訊息。

面對生存風(fēng)險(xiǎn),人類別無選擇,只能團(tuán)結(jié)一致,擱置地緣政治分歧與明顯的私利動機(jī)。這種充滿愿景的科幻想象能否照進(jìn)現(xiàn)實(shí),仍有待回答。筆者對此保持謹(jǐn)慎樂觀。

高端訪談

更多訪談(下滑查看)

中美聚焦網(wǎng)|中美交流基金會

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
于文華不再沉默,回應(yīng)和大衣哥的關(guān)系,多年緋聞傳聞終于真相大白

于文華不再沉默,回應(yīng)和大衣哥的關(guān)系,多年緋聞傳聞終于真相大白

殘夢斷憶
2026-06-17 07:56:20
那位差點(diǎn)改寫泰國歷史的長公主走了,小孩都能扛過去的病終結(jié)了她

那位差點(diǎn)改寫泰國歷史的長公主走了,小孩都能扛過去的病終結(jié)了她

普陀動物世界
2026-06-12 18:32:23
世界杯冷知識:佛得角在地圖上都很難找到,晉級世界杯關(guān)鍵一戰(zhàn)是在中國援建的體育場完成的;庫拉索總?cè)丝谥挥屑s15萬,還沒有中國一個(gè)縣多

世界杯冷知識:佛得角在地圖上都很難找到,晉級世界杯關(guān)鍵一戰(zhàn)是在中國援建的體育場完成的;庫拉索總?cè)丝谥挥屑s15萬,還沒有中國一個(gè)縣多

大風(fēng)新聞
2026-06-16 17:12:55
近視防控鏡到底有多暴利:賣3280元的眼鏡進(jìn)貨價(jià)僅126元 用久還會加深近視

近視防控鏡到底有多暴利:賣3280元的眼鏡進(jìn)貨價(jià)僅126元 用久還會加深近視

快科技
2026-06-15 15:35:20
7年敗光2個(gè)億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

7年敗光2個(gè)億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

林輕吟
2026-02-11 11:29:40
恩佐:我們清楚這可能是梅西最后一屆世界杯,會爭取衛(wèi)冕冠軍

恩佐:我們清楚這可能是梅西最后一屆世界杯,會爭取衛(wèi)冕冠軍

懂球帝
2026-06-16 23:10:20
突尼斯主帥被解雇牽出韓國足球“黑歷史”  車范根火線下課深圳再就業(yè)

突尼斯主帥被解雇牽出韓國足球“黑歷史” 車范根火線下課深圳再就業(yè)

野渡舟山人
2026-06-16 11:43:06
穆氏皇馬中場引援目標(biāo):切爾西恩佐or荷甲6000萬歐小將or鐵錘M費(fèi)

穆氏皇馬中場引援目標(biāo):切爾西恩佐or荷甲6000萬歐小將or鐵錘M費(fèi)

福醬的小時(shí)光
2026-06-17 07:39:02
世界杯開門紅!法國3-1塞內(nèi)加爾,姆巴佩表現(xiàn)如何?最佳球員誕生

世界杯開門紅!法國3-1塞內(nèi)加爾,姆巴佩表現(xiàn)如何?最佳球員誕生

等等talk
2026-06-17 06:14:33
50歲陳坤因容貌變化被傳“被日本人池田替換”,本人回應(yīng):我還活著呢

50歲陳坤因容貌變化被傳“被日本人池田替換”,本人回應(yīng):我還活著呢

老吳教育課堂
2026-06-15 17:30:22
最高院:提供 “口交” “肛交”等進(jìn)入式性服務(wù),是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進(jìn)入式性服務(wù),是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
原來他們用的是藝名??!新規(guī)要求演員必須署真名,這回是藏不住了

原來他們用的是藝名啊!新規(guī)要求演員必須署真名,這回是藏不住了

上官晚安
2026-06-14 20:16:04
局勢已惡化,菲律賓全方位反華,連開3槍逼中國認(rèn)栽,中沒有退路

局勢已惡化,菲律賓全方位反華,連開3槍逼中國認(rèn)栽,中沒有退路

快看張同學(xué)
2026-06-16 19:36:35
86版《西游記》演員定妝照,真正的國色芳華,堪稱審美天花板

86版《西游記》演員定妝照,真正的國色芳華,堪稱審美天花板

娛你同歡
2026-06-15 14:30:23
全是劣質(zhì)品,已流向全國!“李鬼”網(wǎng)店真假難辨,大量假貨摻雜少量正品混發(fā),極難取證,上海人快自查

全是劣質(zhì)品,已流向全國!“李鬼”網(wǎng)店真假難辨,大量假貨摻雜少量正品混發(fā),極難取證,上海人快自查

縱相新聞
2026-06-15 17:30:20
南極傳來兩個(gè)消息,科學(xué)家集體沉默:人類的努力,正在失去意義

南極傳來兩個(gè)消息,科學(xué)家集體沉默:人類的努力,正在失去意義

三農(nóng)老歷
2026-06-14 15:21:21
振聾發(fā)聵!大悲寺發(fā)遏制商業(yè)化通知,網(wǎng)友:中國佛教最后一塊凈土

振聾發(fā)聵!大悲寺發(fā)遏制商業(yè)化通知,網(wǎng)友:中國佛教最后一塊凈土

火山詩話
2026-06-16 11:15:44
“試探性”表態(tài),萬斯:如伊朗履行協(xié)議,可獲得阿拉伯國家3000億美元重建基金支持

“試探性”表態(tài),萬斯:如伊朗履行協(xié)議,可獲得阿拉伯國家3000億美元重建基金支持

環(huán)球網(wǎng)資訊
2026-06-16 08:45:22
涉嫌嚴(yán)重違紀(jì)違法,孫素國被查

涉嫌嚴(yán)重違紀(jì)違法,孫素國被查

都市快報(bào)橙柿互動
2026-06-15 00:19:38
再次澄清!“絕不會參與打?yàn)蹩颂m,因?yàn)楦敬虿贿^”

再次澄清!“絕不會參與打?yàn)蹩颂m,因?yàn)楦敬虿贿^”

觀察者網(wǎng)
2026-06-16 11:42:35
2026-06-17 08:31:00
中美聚焦 incentive-icons
中美聚焦
聚焦中美話題,關(guān)注中美關(guān)系。
3522文章數(shù) 25274關(guān)注度
往期回顧 全部

頭條要聞

副省部級"老虎"降職處分后二次被查 專家:涉兩個(gè)原因

頭條要聞

副省部級"老虎"降職處分后二次被查 專家:涉兩個(gè)原因

體育要聞

身價(jià)5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個(gè)女兒在靈堂內(nèi)茫然失措

財(cái)經(jīng)要聞

從123美元到62美元 白銀價(jià)格上演過山車

科技要聞

借AI東風(fēng)燒赤壁,理想的糧草還夠嗎?

汽車要聞

三車齊發(fā) 零跑全新C10/C11/C16上市12.58萬元起

態(tài)度原創(chuàng)

本地
房產(chǎn)
藝術(shù)
數(shù)碼
公開課

本地新聞

這屆年輕人為什么都在找心流時(shí)刻?

房產(chǎn)要聞

最新房價(jià):海口、三亞;新房、二手房全線下跌!

藝術(shù)要聞

約旦最大的體育場開始建設(shè),計(jì)劃2029年完工!

數(shù)碼要聞

Snap旗下首款面向普通消費(fèi)者的AR眼鏡Specs發(fā)布,2195美元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版