国产人妻精品区一区二区三区_色噜噜狠狠一区二区三区果冻_最新国产の精品合集bt7086_av电影手机在线观看_亚洲国产欧美在线综合其他_成免费crm85171_97人妻人人揉人人澡人人爽国产_色天使久久综合网天天_爱回家之开心速递粤语在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話面壁CEO李大海:端側(cè)AI模型趕上GPT-4,下一程是生態(tài)共建

0
分享至



智東西

作者 | 江宇

編輯 | 漠影

智東西6月12日報道,剛剛,在智源大會期間,面壁智能CEO李大海與AI Infra負(fù)責(zé)人李宇軒與智東西等媒體進(jìn)行了深入交流。從端側(cè)模型進(jìn)展、國產(chǎn)算力適配、智能體落地、開源策略到汽車、手機(jī)等終端場景,李大?;貞?yīng)了外界關(guān)注的多個問題,并拋出不少關(guān)鍵判斷:

1、端側(cè)模型進(jìn)展:此前預(yù)測2026年底端側(cè)模型智能水平達(dá)到GPT-4水平,如今已經(jīng)提前達(dá)到。

2、端側(cè)落地:2025年是端側(cè)模型落地元年,汽車量產(chǎn)是重要標(biāo)志,今年會有更多端側(cè)應(yīng)用落地。

3、端側(cè)角色:面壁會持續(xù)發(fā)布端側(cè)基礎(chǔ)模型,同時服務(wù)重要設(shè)備廠商,也會探索AI原生端側(cè)設(shè)備。

4、智能體:很多場景已經(jīng)可以落地,但外界對零介入、100%完成、100%負(fù)責(zé)的期待仍然偏高。

5、手機(jī)智能體:端側(cè)模型與智能體結(jié)合,重要方向是改變?nèi)伺c設(shè)備的交互方式。

6、國產(chǎn)算力:國產(chǎn)芯片用于訓(xùn)練還需要模型公司與芯片公司更深合作,軟件生態(tài)仍需補(bǔ)課。

7、開源:開源是高效商業(yè)模式,可以用更低成本觸達(dá)潛在客戶,其核心競爭力仍在“冰山之下”。

一、端側(cè)模型提前追上GPT-4,落地還要等芯片一起跟上

在近四十分鐘的群訪中,李大海和李宇軒回答了十余個問題。

我們將關(guān)鍵問題整理如下:

Q1:2024年曾預(yù)測,到2026年底端側(cè)模型智能水平可以達(dá)到GPT-4水平?,F(xiàn)在看,這個目標(biāo)會提前還是延后?

李大海判斷,這個目標(biāo)已經(jīng)提前達(dá)到。

他提到,面壁近期發(fā)布MiniCPM-5 1B版本后,在Artificial Analysis榜單上拿到17.6分。社區(qū)研究者對比發(fā)現(xiàn),2024年5月OpenAI發(fā)布的GPT-4o在該榜單上得分大約只高零點(diǎn)幾分,而GPT-4o參數(shù)規(guī)模約為200B,MiniCPM-5 1B只有1B參數(shù)。

李大海認(rèn)為,這說明面壁仍在踐行其提出的“大模型知識密度定律”。

Q2:端側(cè)模型現(xiàn)在落地到哪些生活場景?為什么用戶感知還不強(qiáng)?

李大海認(rèn)為,2025年可以算作端側(cè)模型落地元年,面壁去年四季度在汽車上正式量產(chǎn),是一個重要標(biāo)志。

他提到,目前端側(cè)模型能力增長很快,但真正往下落地時,最大制約仍然是模型與芯片的結(jié)合?,F(xiàn)在一批國產(chǎn)存算一體端側(cè)AI芯片公司正在流片,一旦芯片回來,能夠提供更有競爭力的功耗、算力和帶寬,端側(cè)應(yīng)用會有更多爆發(fā)。

在他看來,今年會有大量端側(cè)應(yīng)用落地。以“小龍蝦”這類形態(tài)為例,合理方式不是所有推理都放在云端,而是上下文管理放在端上,一部分高頻推理也放在端上,最終形成端云協(xié)同。

Q3:面壁在端側(cè)模型領(lǐng)域的長期定位是什么?

李大海說,面壁對自己的定位是“端側(cè)模型的基礎(chǔ)設(shè)施”。

具體來看,面壁會做三層事情:第一,持續(xù)發(fā)布世界領(lǐng)先的端側(cè)基礎(chǔ)模型,賦能更多開發(fā)者;第二,直接服務(wù)一些出貨量大的重要設(shè)備廠商;第三,在新的AI原生端側(cè)設(shè)備上探索自己的硬件產(chǎn)品。

二、智能體已經(jīng)能落地,但“零介入”還需要時間

Q4:面壁怎么看智能體當(dāng)前的局限?最大問題是成本、穩(wěn)定性、記憶,還是權(quán)限?

李大海認(rèn)為,智能體正在快速進(jìn)化。若要說問題,“哪哪都是問題”,但從技術(shù)發(fā)展角度看,模型與智能體的結(jié)合正在以很快速度推進(jìn)。

他提到,面壁早在2024年就已經(jīng)用智能體技術(shù),在人工智能輔助審判方向協(xié)助法官落地。

不過,李大海也提到,外界對智能體的期待可能偏高,比如希望它零介入、100%做好,并且還能100%負(fù)責(zé)。他認(rèn)為,技術(shù)打磨需要時間,這是自然規(guī)律。

Q5:怎么看豆包手機(jī)這類把智能體放到手機(jī)上的嘗試?

李大海認(rèn)為,這是非常自然的方向。

他解釋說,端側(cè)模型的重要方向之一,就是改變?nèi)伺c設(shè)備的交互方式。端側(cè)模型更隱私友好,實時性和可靠性也更強(qiáng),因此適合承擔(dān)人機(jī)交互任務(wù)。

他還用云游戲做了類比:云游戲一直不溫不火,一個重要原因是用戶對交互幀率和穩(wěn)定性要求很高,不希望出現(xiàn)無預(yù)期卡頓。類似地,人與設(shè)備交互也需要很高實時性和可靠性,這些能力更適合在端上完成。

Q6:做端側(cè)智能體會遇到哪些困難?

李大海說,關(guān)鍵仍然是模型與芯片的結(jié)合。

他把問題概括為三個因素:能力、成本和場景。一個場景能不能落地,要看模型表現(xiàn)、可接受成本和具體應(yīng)用場景之間能否匹配。目前限制主要來自芯片、內(nèi)存和帶寬,但在端側(cè)摩爾定律和端側(cè)模型知識密度定律共同推動下,這些問題正在改善。

三、國產(chǎn)算力開始進(jìn)入訓(xùn)練環(huán)節(jié),軟件生態(tài)還要補(bǔ)課

Q7:依托國產(chǎn)智算集群做訓(xùn)練和推理時,如何提高算力利用率?如何與國產(chǎn)AI芯片廠商、智算中心、算力服務(wù)商協(xié)作?

李大海說,過去行業(yè)更多用英偉達(dá)芯片和集群做訓(xùn)練,推理逐步轉(zhuǎn)移到國產(chǎn)芯片上。今年開始,訓(xùn)練工作也在逐步轉(zhuǎn)向國產(chǎn)卡。

他坦言,相比英偉達(dá)集群,國產(chǎn)芯片集群在軟件生態(tài)上還有很多課要補(bǔ),模型公司不能完全靠自己完成所有適配工作,需要芯片公司提供更多支持。

李大海提到,面壁一方面與國產(chǎn)芯片公司做深入配合,另一方面也與智源主導(dǎo)的FlagOS軟件生態(tài)有深度合作。前者更像是模型訓(xùn)練牽引下的逐步完善,后者則是自頂向下做頂層規(guī)劃,把芯片公司拉進(jìn)來,明確哪些工作更重要,再一步步推進(jìn)。

李宇軒補(bǔ)充說,訓(xùn)練相比推理,對精度要求更高。如果一張卡只做過推理、沒有做過訓(xùn)練,可能會遇到一些意想不到的精度問題。

面壁此前提出“模型風(fēng)洞”技術(shù),即用小模型實驗預(yù)測大模型效果。李宇軒說,面壁把這套基礎(chǔ)設(shè)施先在華為等國產(chǎn)卡上做深度評測,并與英偉達(dá)進(jìn)行對齊,確認(rèn)精度可用,再繼續(xù)推進(jìn)更大模型訓(xùn)練。

Q8:此前提到在昇騰上達(dá)到95%訓(xùn)練效率,另外5%差距來自哪里?

李宇軒澄清說,這里的95%并不是指華為平臺相對英偉達(dá)平臺達(dá)到95%,而是指在華為平臺上,極低位寬量化感知訓(xùn)練相比普通訓(xùn)練達(dá)到95%的效率。

他解釋,訓(xùn)練量化模型時需要加入量化器,這會帶來額外開銷和性能損失。面壁與華為合作優(yōu)化量化器開銷,將損失控制在5%以內(nèi),從而驗證極低位寬訓(xùn)練pipeline在華為平臺上可用。

四、蘋果端側(cè)AI落地不算早,手機(jī)廠商差距還沒拉開

Q9:怎么看蘋果推出端側(cè)大模型?會不會擠壓高端安卓手機(jī)市場?

李大海認(rèn)為,蘋果早在2024年6月就公布了端側(cè)模型與云端協(xié)同戰(zhàn)略。以蘋果的風(fēng)格來看,今天才落地,已經(jīng)晚于行業(yè)預(yù)期。

他還提到,蘋果在大模型上與谷歌有較深合作,這反而凸顯出第三方專業(yè)大模型公司的價值。

李大海認(rèn)為,這件事與安卓還是蘋果沒有本質(zhì)關(guān)系,更重要的是是否找到更好的芯片,以及是否在場景和產(chǎn)品定義上做出更好設(shè)計。以他的觀察,國內(nèi)手機(jī)廠商對這一方向理解都較深,差距并不大。

Q10:手機(jī)廠商選擇面壁,主要看重哪些因素?

對此,李大??偨Y(jié)了三點(diǎn)。

第一,面壁能持續(xù)訓(xùn)練出知識密度足夠高的端側(cè)模型。第二,面壁與很多端側(cè)芯片公司有深度合作,比如與高通已經(jīng)形成全球戰(zhàn)略合作,并達(dá)到協(xié)同設(shè)計程度。第三,面壁在高效推理上積累較多,這對手機(jī)、汽車等功耗敏感設(shè)備很重要。

他說,在同等效果下,如果推理功耗能顯著降低,就是巨大的競爭優(yōu)勢。

Q11:端側(cè)模型壓縮是否有極限?

李大海說,據(jù)他了解,1.58比特應(yīng)該已經(jīng)算是極限。更重要的是,在這樣的壓縮比下,保持足夠少的性能損失。

他提到,李宇軒團(tuán)隊主導(dǎo)的工作,是在訓(xùn)練階段就把三值量化作為量化感知訓(xùn)練的一部分,從訓(xùn)練第一步就持續(xù)考慮和對齊,這對降低量化損失很重要。

五、開源不是簡單開放技術(shù),而是降低客戶驗證成本

Q12:中國大模型公司出海時,如何平衡自主可控與全球開放合作?

李大海認(rèn)為,這兩個方向不沖突。

他解釋說,自主可控是企業(yè)對自身底層能力的內(nèi)生要求;開放合作則體現(xiàn)在靈活商業(yè)合作模式、重視用戶和客戶利益,以及尊重海外客戶和伙伴的文化與需求。

他同時強(qiáng)調(diào),開放不等于無底線開放自己的技術(shù),技術(shù)對外輸出與開放合作是兩個層面的概念。面壁會在國家技術(shù)出口相關(guān)指導(dǎo)方針下推進(jìn)海外合作。

Q13:行業(yè)競爭激烈,面壁為什么仍然堅持開源?

李大海認(rèn)為,開源是一個非常高效的商業(yè)模式,因為它能用更低成本觸達(dá)潛在客戶。

他說,當(dāng)客戶做基礎(chǔ)研究或技術(shù)驗證時,如果模型是開源的,就能低成本試用,也能幫助客戶在內(nèi)部用更扎實的數(shù)據(jù)和證據(jù)說服上級,最終提升從技術(shù)影響力到商業(yè)合作的轉(zhuǎn)化效率。

對于開源是否會培養(yǎng)競爭對手,李大海認(rèn)為,開源模型和框架會產(chǎn)生影響,但不會產(chǎn)生特別實質(zhì)的影響,因為一家公司的核心競爭力在“冰山之下”。已經(jīng)開源出來的東西,不足以讓別人完全學(xué)會公司的核心能力。

他還提到,企業(yè)不能只靠把一時的競爭優(yōu)勢關(guān)起來,而應(yīng)靠技術(shù)前瞻性和速度,持續(xù)構(gòu)建更復(fù)雜的競爭優(yōu)勢。

六、汽車、手機(jī)、無人機(jī)、潛水器都在落地,法律場景也在推進(jìn)

Q14:過去一年,面壁主要有哪些進(jìn)展?未來規(guī)劃是什么?

李大海說,過去一年,面壁在資本市場、技術(shù)和產(chǎn)業(yè)落地上都有進(jìn)展。

資本層面,面壁獲得了更多投資人支持,其中包括具有國家隊屬性的資本和產(chǎn)業(yè)資本。李大海認(rèn)為,這些融資是產(chǎn)業(yè)推進(jìn)的結(jié)果,不是原因。

技術(shù)層面,面壁持續(xù)推進(jìn)基礎(chǔ)模型、數(shù)據(jù)治理、AI訓(xùn)練AI框架等工作,并推出了流式全雙工端側(cè)全模態(tài)模型。

產(chǎn)業(yè)層面,除了智能汽車,面壁也把端側(cè)模型部署到手機(jī)上,并在無人機(jī)、潛水器等智能終端上推進(jìn)端側(cè)模型落地。李大海稱,這些方向可以概括為“上天入地、上天下?!?。

Q15:汽車場景中,用戶和車企反饋如何?

李大海以吉利銀河M9為例說,面壁上車的功能并不是默認(rèn)開放,需要用戶主動打開。車廠反饋顯示,用戶主動打開比例非常高。他認(rèn)為,這代表了用戶對相關(guān)功能的認(rèn)可。

七、端側(cè)AI終局可能是模型與芯片深度合一,但不會很快到來

Q16:端側(cè)AI的終局是模型適應(yīng)芯片,還是芯片適應(yīng)模型?面壁的護(hù)城河是什么?

李大海判斷,未來大模型公司生產(chǎn)出自己的模型后,也可能會同時生產(chǎn)自己的芯片。

不過他認(rèn)為,這可能還需要一段時間。原因在于模型側(cè)可以跑得很快,但芯片流片背后仍有大量不能被AI自動完成的工作。

李大海提到,面壁已經(jīng)初步完成用AI訓(xùn)練AI,下一步自然會考慮如何用AI去流片。但AI流片要克服的問題更多,不會很快到來。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
黃健翔:西班牙受到了傷病困擾,勻速無效傳控缺乏爆點(diǎn)

黃健翔:西班牙受到了傷病困擾,勻速無效傳控缺乏爆點(diǎn)

懂球帝
2026-06-16 20:32:34
掘金徹底重建!約基奇的話也不聽了,全隊僅1人非賣,戈登遭哄搶

掘金徹底重建!約基奇的話也不聽了,全隊僅1人非賣,戈登遭哄搶

你的籃球頻道
2026-06-17 07:58:59
伊朗隊亮相世界杯,用AI讓球員牽遇難兒童入場,紀(jì)念遭美以襲擊喪生的168名學(xué)生;比賽地點(diǎn)在美國洛杉磯體育場,首輪對陣新西蘭

伊朗隊亮相世界杯,用AI讓球員牽遇難兒童入場,紀(jì)念遭美以襲擊喪生的168名學(xué)生;比賽地點(diǎn)在美國洛杉磯體育場,首輪對陣新西蘭

大風(fēng)新聞
2026-06-16 10:20:50
“硬生生把孩子養(yǎng)成了腦缺氧!”全職寶媽曬早餐,看的人力竭!

“硬生生把孩子養(yǎng)成了腦缺氧!”全職寶媽曬早餐,看的人力竭!

林林先生
2026-06-17 08:40:03
39歲梅西,世界波進(jìn)球!

39歲梅西,世界波進(jìn)球!

都市快報橙柿互動
2026-06-17 09:33:51
距首戰(zhàn)僅1天 英格蘭官宣換人 4500萬左閘退出世界杯 藍(lán)軍后衛(wèi)遞補(bǔ)

距首戰(zhàn)僅1天 英格蘭官宣換人 4500萬左閘退出世界杯 藍(lán)軍后衛(wèi)遞補(bǔ)

我愛英超
2026-06-16 21:46:24
推蔡英文出來的呼聲最高?六成臺灣民眾支持兩岸談判,國臺辦表態(tài)

推蔡英文出來的呼聲最高?六成臺灣民眾支持兩岸談判,國臺辦表態(tài)

阿諢體育
2026-06-16 19:30:02
太沉重了!一張殯儀館的電子顯示屏8位逝者,有6人未能活到55歲

太沉重了!一張殯儀館的電子顯示屏8位逝者,有6人未能活到55歲

火山詩話
2026-06-12 08:54:20
3歲男童被小區(qū)大堂大理石桌砸中身亡 家屬怒斥:事發(fā)3天物業(yè)不聞不問

3歲男童被小區(qū)大堂大理石桌砸中身亡 家屬怒斥:事發(fā)3天物業(yè)不聞不問

閃電新聞
2026-06-17 10:32:31
54歲“雙一流”高校副院長離世,曾連續(xù)多年給優(yōu)秀畢業(yè)生頒發(fā)證書

54歲“雙一流”高校副院長離世,曾連續(xù)多年給優(yōu)秀畢業(yè)生頒發(fā)證書

極目新聞
2026-06-16 13:21:08
央媒發(fā)聲!養(yǎng)路費(fèi)改革落地,油電車輛統(tǒng)一征收不一刀切

央媒發(fā)聲!養(yǎng)路費(fèi)改革落地,油電車輛統(tǒng)一征收不一刀切

生活魔術(shù)專家
2026-06-17 02:52:55
凱斯勒拒絕爵士5年1.4億!湖媒盼5年1.3億搶人:先簽后換愿出首輪

凱斯勒拒絕爵士5年1.4億!湖媒盼5年1.3億搶人:先簽后換愿出首輪

顏小白的籃球夢
2026-06-17 09:36:40
山西接連施暴發(fā)小男生母親是民警!冒充民警打人者還有第三人!

山西接連施暴發(fā)小男生母親是民警!冒充民警打人者還有第三人!

聽心堂
2026-06-16 21:08:25
“足球小將”父親公開發(fā)聲,揭開董路私下一面,有一點(diǎn)可以肯定

“足球小將”父親公開發(fā)聲,揭開董路私下一面,有一點(diǎn)可以肯定

觀察鑒娛
2026-06-17 10:23:54
"拒當(dāng)生育工具"帖遭反殺,網(wǎng)友只攻不防降維打擊,評論區(qū)笑不活了

"拒當(dāng)生育工具"帖遭反殺,網(wǎng)友只攻不防降維打擊,評論區(qū)笑不活了

川渝視覺
2026-06-16 12:36:10
重慶95后女生拍下火山灰中的紙鸚鵡螺,捧回全球攝影大獎

重慶95后女生拍下火山灰中的紙鸚鵡螺,捧回全球攝影大獎

陌上桃花開的
2026-06-15 22:58:40
反常識:特斯拉比蔚來輕1噸,胎壓反而更高?背后藏兩大造車邏輯

反常識:特斯拉比蔚來輕1噸,胎壓反而更高?背后藏兩大造車邏輯

華庭講美食
2026-06-16 17:09:05
遠(yuǎn)射破門!梅西打入世界杯個人第14球!與姆巴佩持平,阿根廷暫半場1-0阿爾及利亞

遠(yuǎn)射破門!梅西打入世界杯個人第14球!與姆巴佩持平,阿根廷暫半場1-0阿爾及利亞

大風(fēng)新聞
2026-06-17 10:19:45
5年1.4億!爵士給凱斯勒開出續(xù)約報價 湖人想搶人存在難度

5年1.4億!爵士給凱斯勒開出續(xù)約報價 湖人想搶人存在難度

醉臥浮生
2026-06-17 08:40:07
從電視前到電視里,哈蘭德圓夢世界杯!首秀梅開二度,僅用43分鐘就追平挪威隊史紀(jì)錄

從電視前到電視里,哈蘭德圓夢世界杯!首秀梅開二度,僅用43分鐘就追平挪威隊史紀(jì)錄

紅星新聞
2026-06-17 08:34:31
2026-06-17 11:03:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
12065文章數(shù) 117106關(guān)注度
往期回顧 全部

科技要聞

美國給Anthropic新模型上了“芯片級管制”

頭條要聞

一家四口進(jìn)野山迷路極限求生:自帶飲用水1天就喝完了

頭條要聞

一家四口進(jìn)野山迷路極限求生:自帶飲用水1天就喝完了

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

百花獎名單惹爭議,這5位實在可惜!

財經(jīng)要聞

美媒曝光美伊諒解備忘錄草案完整版

汽車要聞

三車齊發(fā) 零跑全新C10/C11/C16上市12.58萬元起

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
親子
旅游
軍事航空

藝術(shù)要聞

懷素臨終絕筆,草書巔峰作:《四十二章經(jīng)》

數(shù)碼要聞

技嘉B850M背插MicroATX主板即將發(fā)布:支持后置布線以隱藏線路

親子要聞

初為人父,爸爸大腦會“縮水又重塑”?兩項研究:新手父親大腦會發(fā)生結(jié)構(gòu)性改造,全皮層灰質(zhì)體積顯著縮減 0.76%–1.14%

旅游要聞

曲靖馬龍:向日葵花開成海 高鐵飛馳入畫來

軍事要聞

美被指拒絕以色列看美伊諒解備忘錄

無障礙瀏覽 進(jìn)入關(guān)懷版