国产人妻精品区一区二区三区_色噜噜狠狠一区二区三区果冻_最新国产の精品合集bt7086_av电影手机在线观看_亚洲国产欧美在线综合其他_成免费crm85171_97人妻人人揉人人澡人人爽国产_色天使久久综合网天天_爱回家之开心速递粤语在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

今年CVPR看點是廣東:何愷明再獲大獎,廣工大打破大廠名校壟斷

0
分享至

聽雨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

剛剛,CVPR 2026在丹佛頒出了今年的全部重磅獎項!

先給各位來個要點速覽:

  • 最佳論文D4RT,一個能從單段視頻里又快又準地重建動態(tài)4D場景的前饋模型,來自Google DeepMind(聯(lián)合UCL、牛津)。這也意味著CVPR最佳論文連續(xù)兩年頒向了幾何重建(去年是VGGT)。
  • 最佳論文榮譽提名(2篇):Meta的單圖3D重建基座模型SAM 3D,以及英偉達的通用游戲智能體大模型NitroGen
  • 最佳學生論文:清華×微軟的TRELLIS.2——一個全華人陣容做出來的4B參數(shù)3D生成模型。
  • 最佳學生論文提名ChordEdit,一支來自廣工大、深大、北大等的純國內高校團隊,一作還是本科生。
  • 時間檢驗獎(Longuet-Higgins Prize):雙雙頒給2016年的兩位「祖師爺」——ResNet和YOLO
  • PAMI人物獎:年輕學者獎給了CMU的Deepak Pathak和MIT的Vincent Sitzmann;Thomas Huang紀念獎給了康奈爾的Noah Snavely。

今年論文獎的角逐相當慘烈:74篇入圍、15篇殺進決賽圈,最終5篇拿到獎項。

規(guī)模上也是大年——CVPR 2026收到16092篇投稿、錄用4071篇。論文數(shù)量再創(chuàng)新高,比去年增長23.71%。

圖片來自CVPR2026官方X賬號




圖片來自CVPR2026官方X賬號



作者、審稿人、領域主席數(shù)量也全部刷新歷史紀錄。

圖片來自CVPR2026官方X賬號



值得關注但也不意外的是:這屆的華人含量,也幾乎拉滿了

從最佳論文一作,到最佳學生論文的整支隊伍,再到時間檢驗獎里的ResNet四人組,每一格榮譽里都站著華人面孔。

不過這種華人霸榜的局面,過去十年也幾乎是主旋律見怪不怪了,AI研究離不開華人,就像……

但是!今年要說最令人耳目一新的,莫過于一眾大廠名校里,大獎名單里有一個特殊存在——

拿下最佳學生論文提名的ChordEdit,出自廣東工業(yè)大學、惠州學院、深圳大學、北京大學之手。一作以及團隊里其他幾位作者,都還是本科生。

純學術團隊,本科生陣容,一作還是沒有大廠和名校資源的廣東工業(yè)大學。

了不起啊了不起。

當然,CVPR贏麻了的何愷明大神,也是廣東滿分高考狀元。

這屆CVPR,美國丹佛舉辦,但粵是廣東圓了。

最佳論文D4RT:把動態(tài)4D重建做成「隨用隨查」

今年CVPR的最佳論文是D4RT(《Effciently Reconstructing Dynamic Scenes One D4RT at a Time》)。

圖片來自CVPR2026官方X賬號



從一段普通視頻里,重建出場景隨時間變化的幾何與運動——也就是所謂的4D重建(3D空間+時間),一直是計算機視覺里最難啃的骨頭之一。

過去的方法要么把任務拆成一堆模塊分頭處理(又慢又復雜),要么干脆搞不定動態(tài)區(qū)域的點對應關系,常常是幾個毛病一起犯。

D4RT則換了個思路:把「逐幀把所有東西都解碼一遍」的笨辦法,改成「你問哪兒、我答哪兒」的按需查詢



具體來說,模型先用一個編碼器,把整段視頻壓成一份全局場景表示;再掛一個輕量解碼器,專門回答這么一個問題——

「視頻里某個點,在某個時刻的三維位置是多少?」

深度圖、點云、點軌跡、相機參數(shù),全都從這同一套查詢接口里吐出來,不用再為每個任務各養(yǎng)一個解碼器。

效果上數(shù)字也很能打:在A100上,D4RT做位姿估計能跑到200+ FPS比去年的最佳論文VGGT快約9倍,比MegaSaM快約100倍,精度還反超。

在一系列動態(tài)4D重建與追蹤任務上刷新SOTA,并且支持對視頻全部像素做稠密整體重建。

這里藏著一個有意思的「師承」彩蛋:去年CVPR 2025最佳論文是出自牛津VGG實驗室的VGGT,今年D4RT直接把VGGT拎出來當主要對手按在地上摩擦。

而D4RT的作者名單里,正坐著VGG的靈魂人物Andrew Zisserman

同一條幾何重建脈絡,連續(xù)兩年拿下CVPR最高榮譽。

其他榮譽:提名、時間檢驗獎、學生論文、人物獎

最佳論文榮譽提名(2篇)

一篇是SAM 3D(《SAM 3D:3Dfy Anything in Images》),出自Meta超級智能實驗室。

圖片來自CVPR2026官方X賬號



這篇論文把「SAM」系列從分割延伸到了單圖3D重建

給一張普通照片,它就能預測物體的幾何、紋理和空間布局,尤其擅長應付現(xiàn)實照片里常見的遮擋和雜亂場景。

背后是一套「人機協(xié)同」標注流水線,以前所未有的規(guī)模拿到帶視覺grounding的3D數(shù)據(jù),靠合成預訓練+真實對齊的多階段訓練,捅破了3D領域長期的「數(shù)據(jù)墻」。

在面向真實物體和場景的人類偏好測試里,它拿到了至少5:1的勝率。

另一篇是NitroGen(《NitroGen: An Open Foundation Model for Generalist Gaming Agents》)。

圖片來自CVPR2026官方X賬號



來自英偉達、斯坦福大學、加州理工學院、芝加哥大學和德克薩斯大學奧斯汀分校。

NitroGen是一個通用游戲智能體的開源基座模型。它在1000多款游戲、共4萬小時游戲視頻上訓練,核心做了三件事:

  • 用自動化方式從公開游戲視頻里反解出玩家動作、構建互聯(lián)網(wǎng)規(guī)模的「視頻-動作」數(shù)據(jù)集;
  • 搭一個能衡量跨游戲泛化的多游戲評測環(huán)境;
  • 再用大規(guī)模行為克隆訓出統(tǒng)一的「視覺-動作」策略。

從3D動作游戲的戰(zhàn)斗,到2D平臺跳躍的精細操作,再到程序生成世界里的探索它都能拿下,遷移到沒見過的新游戲時,任務成功率最高有52%的相對提升。

這支隊伍正是當年用MineDojo拿下NeurIPS最佳論文的英偉達班底。

時間檢驗獎(Longuet-Higgins Prize)

這個獎專頒給「發(fā)表十年、扛住了時間考驗」的CVPR論文,今年一口氣給了2016年發(fā)表的兩篇:

一篇是ResNet(《Deep Residual Learning for Image Recognition》)。

圖片來自CVPR2026官方X賬號



ResNet用殘差連接破解了深層網(wǎng)絡「越深越難訓」的死結,讓上百層的網(wǎng)絡真正可訓。

十年來它幾乎成了深度學習的默認地基,從視覺的CNN到NLP的Transformer再到大模型,處處都有殘差連接的影子。

目前引用量已超過32萬

另一篇是YOLO v1的原始論文。

圖片來自CVPR2026官方X賬號



在它之前,檢測主流是「先圈候選框、再逐個分類」的R-CNN路線。

YOLO把檢測一把改寫成端到端回歸,整張圖只看一次就直接輸出「哪里有什么」。在Titan X上跑到45 FPS、Fast版本更是155 FPS,第一次讓「實時檢測」真正可用,直接催生了SSD、RetinaNet和后來整個YOLO家族。

目前引用量接近8萬

最佳學生論文:TRELLIS.2

獲獎論文《Native and Compact Structured Latents for 3D Generation》,來自清華大學、微軟研究院、中科大與Microsoft AI。

它有個更響亮的名字:TRELLIS.2

圖片來自CVPR2026官方X賬號



它要解決的,是當前3D生成「畫面越來越真、但表示方法拖后腿」的尷尬:復雜拓撲、精細外觀總是抓不住。

團隊的解法是一種叫O-Voxel的新型稀疏體素結構,把幾何和外觀(連PBR材質參數(shù)都算上)同時編進去,能穩(wěn)穩(wěn)建模開放面、非流形、全封閉等各種刁鉆拓撲。

再配一個稀疏壓縮VAE把它壓成緊湊的潛在空間,最后訓了個40億參數(shù)的flow-matching大模型來做圖生3D。

規(guī)模雖大,推理卻很快,生成資產的幾何和材質質量都明顯甩開現(xiàn)有模型。

最佳學生論文提名:ChordEdit

《ChordEdit: One-Step Low-Energy Transport for Image Editing》,來自廣東工業(yè)大學、惠州學院、深圳大學和北京大學,同時也是今年的Oral。

圖片來自CVPR2026官方X賬號



它解決的是一步式(單步推理)文生圖模型的痛點:這類模型生成飛快,但想拿來做文本引導的圖像編輯,硬壓成一步往往就崩——物體變形、該保留的地方也跟著亂。

團隊把圖像編輯重新表述成一個最優(yōu)傳輸問題:在源文本和目標文本各自定義的分布之間做傳輸,再基于動態(tài)最優(yōu)傳輸理論推出一套低能量控制策略,讓編輯場更平滑、更穩(wěn),一大步就能走完。

最終效果是:這些「快但難編輯」的模型,第一次真正具備了實時編輯能力。

PAMI人物獎

年輕學者獎(Young Researcher Award),頒給博士畢業(yè)7年內、已形成代表性研究方向的青年學者。今年獲獎的有兩位。

一位是Deepak Pathak,CMU副教授,橫跨CV、機器學習與機器人,研究機器人如何在真實世界里學習、感知與行動。

另一位是Vincent Sitzmann,MIT副教授,主攻神經場景表示、3D視覺、世界模型等,目標是讓機器像人一樣理解和模擬世界。

圖片來自CVPR2026官方X賬號



Thomas S. Huang紀念獎,表彰在研究、教學/指導與社區(qū)服務上堪稱典范的學者。

今年授予康奈爾大學教授Noah Snavely(計算機視覺與圖形學)。



值得一提的是,這個獎本身正是為紀念已故華裔計算機視覺先驅黃煦濤(Thomas S. Huang)而設。

CVPR依舊華人閃耀

這屆CVPR,華人含量依然很高。

這種存在感,從投審兩端的數(shù)據(jù)就能看出來:在作者來源地里,中國以23233人斷層第一,幾乎是第二名美國(7556)的三倍。

審稿人同樣是中國(10687)人數(shù)更多。

圖片來自CVPR2026官方X賬號



再看各路獲獎論文,華人面孔也是層出不窮。

最佳論文D4RT的一作是DeepMind資深研究科學家Chuhan Zhang(張楚晗)。



她此前在牛津大學幾何研究組 (VGG)獲得博士學位,導師正是Andrew Zisserman,研究方向覆蓋視頻理解、動態(tài)3D場景重建和生成模型的自動評估。



最佳論文的作者中,還包括牛津與DeepMind的多位華人研究者。



Junyu Xie,同樣來自牛津VGG,師從Andrew Zisserman和謝偉迪。D4RT正是他2025年夏在DeepMind實習期間完成的工作。



還有Shuyang SunJunlin Zhang,均為Google DeeoMind研究員。



最佳學生論文TRELLIS.2,整支隊伍是全華人陣容



一作Jianfeng Xiang(向劍鋒)是清華博士生,同時也是上一代爆款3D生成模型TRELLIS(v1)的一作。



Xiaoxue Chen(陳小雪),清華大學人工智能產業(yè)研究院(AIR)的博士研究生,研究方向為計算機視覺。



通訊作者Jiaolong Yang(楊蛟龍)來自微軟亞研院,長期深耕3D視覺與生成。



Sicheng Xu(徐思成),同樣來自微軟亞研院,研究方向為物理人工智能和多模態(tài)。



Ruicheng Wang(王瑞程),中國科學技術大學計算機科學與技術學院的博士生,研究方向為空間智能。



Zelong Lv,中國科學技術大學計算機科學學院博士生。



Yu Deng(鄧譽),微軟亞研院高級研究員,研究方向為3D視覺生成、空間理解和具身智能。



Hao Zhao(趙昊),清華大學智能產業(yè)研究院(AIR)助理教授,曾任Intel Labs China研究科學家。研究方向為機器人3D場景理解、具身智能、自動駕駛。



Nicholas Jing Yuan(袁晶),微軟全球合伙人、全球資深副總裁技術顧問;IEEE Fellow,引用17000+

此前曾任華為云人工智能副總裁、首席科學家兼語言與語音創(chuàng)新實驗室主任。在微軟期間,主導開發(fā)了微軟小冰人工智能生成內容技術。



最佳學生論文提名ChordEdit,則是一支純國內高校班底,甚至其中有不少本科生。



一作Liangsi Lu(盧梁司),廣東工業(yè)大學信息與計算科學專業(yè)的本科生,研究方向為表征學習和視覺生成。



通訊作者Yang Shi,廣東工業(yè)大學計算機科學學院的本科生,研究方向為計算機視覺和數(shù)據(jù)挖掘。



團隊還有來自深圳大學、北京大學等的研究者,是今年華人榮譽里少見的「全本土」隊伍。

Xuhang Chen,惠州學院計算機科學與工程學院講師,同時在旭日信息科技擔任研究員。2025年在澳門大學和中國科學院深圳先進技術研究院(SIAT)獲得計算機科學博士學位。



此外還有Minzhe Guo(來自廣東工業(yè)大學)、Shichu Li(來自深圳大學)、Jingchao Wang(來自北京大學)等作者。

接下來是時間檢驗獎ResNet的四位作者——何愷明、張祥雨、任少卿、孫劍

這篇十年前從微軟亞洲研究院走出的工作,如今幾乎撐起了半個深度學習世界。

一作何愷明是其中最廣為人知的那個。

ResNet之后,他又先后做出了Mask R-CNN、FPN、MAE等一系列奠基性工作,目前已從Meta AI轉赴MIT任教,是當下計算機視覺領域引用量最高的研究者之一。



也有網(wǎng)友在X上po出了與愷明的合照,感覺大佬好像瘦了呢(狗頭

此外,Meta的超級智能實驗室(MSL)和英偉達的兩篇提名論文里,華人作者也非常多,放眼過去簡直是「人從眾」……



小道消息表示,Meta內部的非華人員工會感覺自己融入不進去公司,因為團隊里華人太多了…嗯,從這個論文名單里也能一窺一二。



感興趣的朋友還可以繼續(xù)深挖(小編已力竭.jpg)。

總之,讓我們祝賀在CVPR 2026獲得認可和嘉獎的所有朋友,也準備好接下來在如此火爆的AI時代被追逐的準備吧~

茍富貴,好好推動AI,造福全人類~


[1]https://x.com/CVPR/status/2062912255470317909

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“好好的孩子,毀你倆手了!”夫妻倆不接老師電話,錯過中考繳費

“好好的孩子,毀你倆手了!”夫妻倆不接老師電話,錯過中考繳費

林林先生
2026-06-15 10:08:40
中國靈活就業(yè)者突破3.2億大關,占就業(yè)人口比例高達44%。

中國靈活就業(yè)者突破3.2億大關,占就業(yè)人口比例高達44%。

流蘇晚晴
2026-06-13 18:21:18
佘詩曼生日飯局古天樂現(xiàn)身,大合照企埋一邊依然咁搶眼

佘詩曼生日飯局古天樂現(xiàn)身,大合照企埋一邊依然咁搶眼

粵睇先生
2026-06-16 23:56:33
選中國,還是選日本?G7成員國亮出最新政策,高市早苗被釜底抽薪

選中國,還是選日本?G7成員國亮出最新政策,高市早苗被釜底抽薪

影孖看世界
2026-06-16 20:28:50
德國緊隨韓國之后,也發(fā)布了“中文標語”,引起了中國游客的不滿

德國緊隨韓國之后,也發(fā)布了“中文標語”,引起了中國游客的不滿

溫讀史
2026-04-03 09:46:40
央企“最牛女副處長”落馬:兩年與上司開房410次,細節(jié)曝光

央企“最牛女副處長”落馬:兩年與上司開房410次,細節(jié)曝光

西門老爹
2025-12-16 15:35:31
金價6月17日,大家要擦亮雙眼了,明后兩天,金價或將重現(xiàn)歷史了

金價6月17日,大家要擦亮雙眼了,明后兩天,金價或將重現(xiàn)歷史了

趣味萌寵的日常
2026-06-17 05:00:09
廣州一樓盤銷售,騙走購房款,幾十人上當!地產公司:已報案

廣州一樓盤銷售,騙走購房款,幾十人上當!地產公司:已報案

靚仔情感
2026-06-17 04:10:46
被員工在自家直播間爆料!老牌國貨創(chuàng)始人:已報警!很多深圳人買過

被員工在自家直播間爆料!老牌國貨創(chuàng)始人:已報警!很多深圳人買過

南方都市報
2026-06-16 19:52:55
楊天真曝經紀人簽1000萬告訴藝人500萬,很多藝人知道但是沒辦法

楊天真曝經紀人簽1000萬告訴藝人500萬,很多藝人知道但是沒辦法

韓小娛
2026-06-17 08:03:44
李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

娛樂團長
2026-06-02 15:09:12
《年會不能停2》劇組上影節(jié)走紅毯,演員高葉兩次欲言又止,堅持讓張若昀、白客先發(fā)言,與片方演員表排序保持一致

《年會不能停2》劇組上影節(jié)走紅毯,演員高葉兩次欲言又止,堅持讓張若昀、白客先發(fā)言,與片方演員表排序保持一致

極目新聞
2026-06-14 20:06:31
賴清德剛對大陸下戰(zhàn)書,兩岸就在廈門簽約,鄭麗文終于等來機會

賴清德剛對大陸下戰(zhàn)書,兩岸就在廈門簽約,鄭麗文終于等來機會

小影的娛樂
2026-06-16 17:05:04
他是大家熟悉的演員,娶小27歲央視主持人,快60歲才老來得女

他是大家熟悉的演員,娶小27歲央視主持人,快60歲才老來得女

史行途
2026-06-16 20:21:05
局勢已惡化,菲律賓全方位反華,連開3槍逼中國認栽,中沒有退路

局勢已惡化,菲律賓全方位反華,連開3槍逼中國認栽,中沒有退路

快看張同學
2026-06-16 19:36:35
莫言:如果你混到沒人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

莫言:如果你混到沒人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

品讀時刻
2026-05-27 09:00:58
震驚!女子得知被拒相親男娶“潮汕A9家庭”妻子,控訴他隱瞞家底

震驚!女子得知被拒相親男娶“潮汕A9家庭”妻子,控訴他隱瞞家底

火山詩話
2026-06-14 12:48:44
纖細身形 + 瑜伽褲穿搭文案|瘦小女生穿出別致線條美感

纖細身形 + 瑜伽褲穿搭文案|瘦小女生穿出別致線條美感

只要高興就好
2026-06-03 11:46:20
奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

品牌營銷報
2026-02-23 11:31:10
吉林女子控訴前夫不給孩子生活費,只能吃泡面,轉頭曬海景房自拍

吉林女子控訴前夫不給孩子生活費,只能吃泡面,轉頭曬海景房自拍

搗蛋窩
2026-06-15 07:31:15
2026-06-17 08:43:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12798文章數(shù) 176499關注度
往期回顧 全部

教育要聞

今天,2026年北京市高考評卷媒體開放日活動舉行,將于6月25日中午前發(fā)布考生高考成績

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀錄破了個遍

頭條要聞

超越吉魯、超越梅西 27歲的姆巴佩這夜把紀錄破了個遍

體育要聞

身價5萬的門將,擋住了12億歐元的狂轟濫炸

娛樂要聞

吳文忻葬禮:2個女兒在靈堂內茫然失措

財經要聞

美媒曝光美伊諒解備忘錄草案完整版

科技要聞

美國給Anthropic新模型上了“芯片級管制”

汽車要聞

三車齊發(fā) 零跑全新C10/C11/C16上市12.58萬元起

態(tài)度原創(chuàng)

家居
時尚
旅游
數(shù)碼
教育

家居要聞

綠意盎然 自然之境

夏天最好看的6只包!照著搭美出新高度

旅游要聞

章丘公園的荷花盛開

數(shù)碼要聞

華碩上架新款破曉7S銳龍版:AI 5 330 + 16G + 1T售6999元

教育要聞

高考正是展示女子新字的好機會!忮賢忌能這種“好詞”只用在游戲

無障礙瀏覽 進入關懷版