国产人妻精品区一区二区三区_色噜噜狠狠一区二区三区果冻_最新国产の精品合集bt7086_av电影手机在线观看_亚洲国产欧美在线综合其他_成免费crm85171_97人妻人人揉人人澡人人爽国产_色天使久久综合网天天_爱回家之开心速递粤语在线观看

網易首頁 > 網易號 > 正文 申請入駐

她曾掌舵OpenAI技術,如今要顛覆OpenAI的規(guī)則

0
分享至


恕我直言,今天你跟AI的交流,跟對講機沒什么區(qū)別。

輸入,發(fā)送,它開始思考。你盯著屏幕,等幾秒,甚至幾分鐘。然后它吐出一大段文字。你讀完,再輸入下一條。

如果人機交互永遠停留在這個方式,AGI不會到來。

因為人類協(xié)作從來不是回合制的。兩個人面對面吵架,語氣、表情、停頓、搶話,信息在每一個毫秒里流動。這才是真實的帶寬。

有一家公司正在改寫這個規(guī)則。它叫Thinking Machines Lab,創(chuàng)始人Mira Murati,前OpenAI首席技術官。她的目標與老東家不同:OpenAI做頂級閉源模型,她做人類與AI的協(xié)作。


要協(xié)作,先掀翻回合制。

昨天,TML發(fā)布了TML-Interaction-Small。名字叫Small,參數2760億,是行業(yè)內第一個原生支持實時、多模態(tài)人機協(xié)作的大模型。0.4秒響應延遲,無需喚醒的視覺主動介入,聽、看、想、說四個動作同步。

在智能和交互的基準測試中,它雙雙登頂。部分競品連參賽資格都沒有。

大模型下半場的戰(zhàn)役,已經從算力與參數的堆砌,演變?yōu)闄C器情商與交互本能的革命。

01

外掛是一條死路

回想一下,為什么面對面吵架比發(fā)郵件高效?

郵件是回合制的。你寫一段,我回一段。中間隔著思考和打字的時間,情緒、表情、語氣全部丟失。面對面不同。我還沒說完,你就打斷;我剛皺眉,你就調整說辭。信息的交換是并行的、連續(xù)的、雙向的。

當前的AI,包括OpenAI和Anthropic的旗艦產品,本質上都是郵件模式。

TML的技術報告里給這種現(xiàn)象起了個名字:單線程現(xiàn)實感知。用戶說完之前,AI處于“五感消失”狀態(tài)。它聽不到你的語氣,看不到你的表情,不知道你停頓是因為猶豫還是因為喘氣。它生成回答的過程中,感知同樣被凍結。除非你強行打斷,否則它就像一臺背誦錄音機,從頭放到尾。

這套機制的根源在于架構。現(xiàn)有的多模態(tài)AI,絕大部分是外掛縫合的。語音活動檢測模塊判斷用戶是否說完,語音識別模塊把聲音轉成文字,大語言模型思考,語音合成模塊把文字讀出來。級聯(lián),串行,每一步都增加延遲,每一步都丟失信息。

強化學習之父Rich Sutton在《The Bitter Lesson》里說過一句話,TML把它貼在報告里:所有依賴人類手工設計的復雜外掛系統(tǒng),最終都會被底層模型通過暴力計算和統(tǒng)一架構降維打擊。


翻譯成人話:外掛沒有未來。真正的交互能力,必須長在模型身體里,像呼吸一樣自然。從提示詞驅動,升級為伴隨式協(xié)作。

02

雙向奔赴的無縫交互

說起來簡單,做起來難。要在技術底層徹底打破“回合制”的束縛,難度無異于給天上的飛機更換引擎。

TML-Interaction-Small(以下簡稱TML-Small)之所以能做到聽、看、想、說四個動作的同步,源于底層架構的四個易于理解的顛覆性創(chuàng)新:

1.時間對齊的微輪轉

這就是TML架構中最有想象力的核心。

傳統(tǒng)的Transformer架構把輸入和輸出的信息流都壓縮成了一個有序的token序列。但文字與音頻和視頻包含的信息量和復雜程度截然不同,不能被簡單地劃分到同一個維度之中,因此TML-Small將現(xiàn)實世界的連續(xù)音視頻流都切分成了每200毫秒一個的“微輪轉”。


在這個200毫秒的微小切片之內,模型同時接收輸入并生成輸出。它無需等待用戶完成整個交互過程,只需要用這種高頻碎片化的方式就可以持續(xù)不斷地與用戶進行雙向的信息交換。

這種類似微積分的處理方式有效地打破了人為設置的“回合邊界”,模型也能夠自然地聽懂人們說話時喘氣帶來的停頓和話語權的交接。當前音頻模型主要的應用場景“同聲傳譯”即可由此實現(xiàn)。

2.無編碼器的早期融合

告別了“縫合怪”,TML也實現(xiàn)了極致的早期融合。

由于堅信外掛的模塊不是通往AGI的正確道路,這款新模型沒有采用龐大的獨立語音識別系統(tǒng)或視覺編碼模型。

音頻被直接轉化為dMel信號,視頻畫面被切分為40×40像素的微小圖塊并經過輕量級的MLP網絡處理,隨后這些音視頻的原始切片就會和文本一起送入同一個Transformer架構之中。


所有組件都從零開始聯(lián)合訓練,就是TML-Small能夠做到零損耗和無時差的原生多模態(tài)感知的秘訣。

3.前臺交互+后臺思考的雙軌系統(tǒng)

性能、速度和成本,全球的AI企業(yè)都在費盡心思試圖突破這個不可能三角的邊界。很多端到端的語音大模型為了追求毫秒級的延遲,往往只能做簡單的閑聊,也就是只能做一些簡單的翻譯,一旦遇到復雜的數學推理或是編程直接崩潰。

TML給出了一種優(yōu)雅的架構解法:雙軌并行。


交互模型始終駐留前臺,保持實時在線,和人類企業(yè)的前臺服務人員一樣負責察言觀色、快速回應、穩(wěn)住場面。

一旦遇到需要深思熟慮、調用搜索、使用工具的復雜任務時,前臺就會將豐富的上下文打包給后臺進行異步處理。

4.2760億參數的算力經濟學與底層工程

如此高頻的交互,必然會帶來致命的算力成本壓力。好在,TML-Small并非浪得虛名,作為一個276B參數的混合專家(MoE)模型,每次推理時的活躍參數僅有12B。

同時,為了應對海量200毫秒級別的碎片產生的推理開銷,TML團隊也學習國產AI企業(yè)深入底層,開發(fā)了流式會話(Streaming sessions)技術。通過在GPU內存中持久化保留序列能夠避免頻繁的內存重新分配,這套優(yōu)化方案也已經貢獻給了開源框架SGLang。

03

競品連考場都進不去

榜單上的數據讓人沉默。

在“智能與交互質量”的綜合評估中,TML-Small同時占據高智商和快響應兩個角落的頂點。在交互延遲測試中,它跑出0.40秒,比OpenAI和Google的最新實時模型還快,接近人類本能反應的極限。


但真正讓人震撼的是另外兩件事。

第一件,TML被迫創(chuàng)建了全新的評測維度。因為現(xiàn)有的商業(yè)模型,在這些任務上的得分基本都是零。測試很簡單:用戶要求每4秒提醒一次深呼吸。TML-Small準確率超過60%。其它模型陷入沉默。它們沒有時間觀念。

第二件,主動視覺測試。傳統(tǒng)的語音助手必須聽到喚醒詞才看一眼屏幕。TML-Small主動盯著屏幕,用戶完成目標時主動插話提示。沒有喚醒,沒有外掛,AI第一次真正長出了眼睛,擁有了時間。

04

帶寬躍遷之后的世界

一旦AI突破了回合制的協(xié)作帶寬瓶頸,它就不再是一個屏幕里的文本生成器。幾個行業(yè)的商業(yè)邏輯將被重寫。

數字員工的定義要改了?,F(xiàn)在的AI客服只會照本宣科。你語氣變了,它聽不出來;你皺眉了,它看不見。換成一個擁有TML能力的數字員工,它能在你不耐煩之前主動停掉冗長的回答,能在你猶豫時補充信息??头N售、咨詢,這些依賴人類情緒識別的行業(yè),將迎來一次范圍打擊。

空間計算和下一代游戲也會變。蘋果Vision Pro被詬病“缺乏靈魂”,缺的就是一個實時伴隨的智能體。TML驅動的AR眼鏡,智能體和你看到同樣的景象,能做危險提示,能同聲傳譯。游戲里的NPC不用再呆呆地站在固定位置,它們有時間觀念,能主動互動,徹底擺脫腳本。

具身智能終于有了大腦。自動駕駛和機器人面對的世界沒有暫停鍵。傳統(tǒng)大模型“等你說完我再思考”的模式,對機器人來說是致命的卡頓。TML每200毫秒處理一次的機制,恰好匹配機器人底層“感知—決策—控制”的循環(huán)。這是現(xiàn)階段的最優(yōu)解,也是唯一解。

05

結語

TML在報告結尾坦承了局限:超長會話的上下文管理、對優(yōu)質網絡的依賴。但更大規(guī)模的模型將在今年晚些時候推出。

過去三年,行業(yè)拼命堆砌參數,讓AI寫更復雜的代碼、解更難的數學題。有一件事正在被淡忘:

人類文明的偉大,不僅有個體的靈光一現(xiàn),還有協(xié)作與溝通的本能。

當人類試圖打造AGI時,讓機器懂得如何與人類同頻呼吸、無縫交流,遠比讓它變得更聰明更加重要。

對講機時代應該結束了。

轉載開白 | 商務合作 | 內容交流

請?zhí)砑游⑿牛篶utstill

添加微信請備注姓名公司與來意

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
北京“退衣姐”被刑拘!換賬號調包退貨她干了4年|大象夜讀

北京“退衣姐”被刑拘!換賬號調包退貨她干了4年|大象夜讀

大象新聞
2026-06-16 19:23:35
“購車后一個星期就發(fā)現(xiàn)空調噴白色粉末”,速騰“噴粉”波及寶來!一汽-大眾稱顆粒無害、免費換空調蒸發(fā)器,多位車主陷“拆修”兩難

“購車后一個星期就發(fā)現(xiàn)空調噴白色粉末”,速騰“噴粉”波及寶來!一汽-大眾稱顆粒無害、免費換空調蒸發(fā)器,多位車主陷“拆修”兩難

每日經濟新聞
2026-06-16 21:40:50
尷尬!巴西男球迷看臺上緊盯女伴胸部看 被轉播鏡頭拍到后生無可戀

尷尬!巴西男球迷看臺上緊盯女伴胸部看 被轉播鏡頭拍到后生無可戀

風過鄉(xiāng)
2026-06-16 13:11:30
山東3億北斗工程現(xiàn)“脆皮底座”,官方組成聯(lián)合調查組

山東3億北斗工程現(xiàn)“脆皮底座”,官方組成聯(lián)合調查組

界面新聞
2026-06-17 08:03:46
必勝客,被賣了

必勝客,被賣了

澎湃新聞
2026-06-16 23:59:03
特朗普直言不想為臺海開戰(zhàn),國會立馬立法鎖死對臺強硬路線

特朗普直言不想為臺海開戰(zhàn),國會立馬立法鎖死對臺強硬路線

健身狂人
2026-06-16 20:29:01
五月的消費數據爆了

五月的消費數據爆了

大何日拱一卒
2026-06-16 18:33:13
76歲上海阿婆被星探邀約做代言人,還差點參加春晚彩排?警方緊急攔停3次!

76歲上海阿婆被星探邀約做代言人,還差點參加春晚彩排?警方緊急攔停3次!

新民晚報
2026-06-16 10:49:59
給伊朗的3000億賠款,特朗普一分不出,要讓叫最歡的海灣國家買單

給伊朗的3000億賠款,特朗普一分不出,要讓叫最歡的海灣國家買單

共工之錨
2026-06-17 00:31:30
日本國腳竟是輪奸犯?主教練曾回應:只是失誤!此前多名日本前國腳陷入性侵丑聞

日本國腳竟是輪奸犯?主教練曾回應:只是失誤!此前多名日本前國腳陷入性侵丑聞

新民周刊
2026-06-16 15:05:47
高校,瘋狂擴招了

高校,瘋狂擴招了

城市財經
2026-06-15 11:45:40
這個小女孩火了!大聲吐槽雷軍:吃早飯還要拍照,評論區(qū)替她擔心

這個小女孩火了!大聲吐槽雷軍:吃早飯還要拍照,評論區(qū)替她擔心

譚談社會
2026-06-16 19:46:45
寶媽誤發(fā)私密視頻風波未停:最該譴責的,從來不是失手的當事人

寶媽誤發(fā)私密視頻風波未停:最該譴責的,從來不是失手的當事人

千言娛樂記
2026-06-15 16:54:12
雷軍被罵東施效顰!都是在街邊,都是吃面,遭嘲諷模仿黃仁勛翻車

雷軍被罵東施效顰!都是在街邊,都是吃面,遭嘲諷模仿黃仁勛翻車

譚談社會
2026-06-16 18:34:43
樂山一事業(yè)單位招考2名臨聘人員進面試,崗位被質疑為“蘿卜崗”,涉事單位否認

樂山一事業(yè)單位招考2名臨聘人員進面試,崗位被質疑為“蘿卜崗”,涉事單位否認

瀟湘晨報
2026-06-16 21:11:02
山東一村莊老齡化率近50%!老兩口月收入僅436元,全靠2元集體食堂存活

山東一村莊老齡化率近50%!老兩口月收入僅436元,全靠2元集體食堂存活

風向觀察
2026-06-16 09:09:46
4.6萬婚宴上預制菜后續(xù):黑料被扒,新郎身份曝光,踢到鐵板了

4.6萬婚宴上預制菜后續(xù):黑料被扒,新郎身份曝光,踢到鐵板了

阿纂看事
2026-06-16 18:41:03
拿清華全額獎學金留學,印度女學生回國瘋狂吐槽:中國是封閉社會

拿清華全額獎學金留學,印度女學生回國瘋狂吐槽:中國是封閉社會

小徐講八卦
2026-06-16 14:59:41
世界杯神助攻!24歲巨星加冕MVP:1腳穿透4人 姆巴佩感謝他

世界杯神助攻!24歲巨星加冕MVP:1腳穿透4人 姆巴佩感謝他

葉青足球世界
2026-06-17 06:54:26
伊朗戰(zhàn)爭是美國最重大的戰(zhàn)略失誤之一,特朗普戰(zhàn)前宣布的5個目標全部失敗

伊朗戰(zhàn)爭是美國最重大的戰(zhàn)略失誤之一,特朗普戰(zhàn)前宣布的5個目標全部失敗

互聯(lián)網大觀
2026-06-16 10:35:36
2026-06-17 08:40:49
硅基星芒AI
硅基星芒AI
錦緞旗下人工智能研究與媒體服務平臺
73文章數 7關注度
往期回顧 全部

科技要聞

美國給Anthropic新模型上了“芯片級管制”

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀錄破了個遍

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀錄破了個遍

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內茫然失措

財經要聞

美媒曝光美伊諒解備忘錄草案完整版

汽車要聞

三車齊發(fā) 零跑全新C10/C11/C16上市12.58萬元起

態(tài)度原創(chuàng)

家居
藝術
手機
本地
公開課

家居要聞

綠意盎然 自然之境

藝術要聞

懷素臨終絕筆,草書巔峰作:《四十二章經》

手機要聞

前五個月旗艦銷量排排座,蘋果霸占前三,華為國產第一

本地新聞

這屆年輕人為什么都在找心流時刻?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版