Warning: session_start(): open(/var/www/vhosts/vandaily.com/php_session/sess_308e2df3f4232ad08e1c5ca6c7314ec4, O_RDWR) failed: No space left on device (28) in /var/www/vhosts/vandaily.com/httpdocs/includes/session_new.php on line 34
半壁華人!GPT Image 2團隊曝光 13人4個月封神 | 溫哥華教育中心
   

半壁華人!GPT Image 2團隊曝光 13人4個月封神

通過過自動構建互聯網規模的3D空間推理 VQA 數據集(1000 萬圖像、20 億 QA 對),為視覺語言模型賦予定量 / 定性空間推理能力,可從單張 2D 圖像輸出米制距離、尺寸、方位等精確數值。


這項研究把思維鏈空間推理應用到了具身智能領域。



谷歌實習期間,他開發的指令微調技術後續還被Gemini 2.0采用。

他在高中參加科研夏令營時,還不懂Python的基本語法,那時結識的谷歌DeepMind資深研究員夏斐把他引入了AI世界。

夏斐兩次邀請他到DeepMind完成高質量實習,這些經歷使陳博遠積累了大規模模型訓練的工程經驗,也為他理解多模態系統的數據需求提供了寶貴視角。

博士畢業後,陳博遠於2025年6月加入OpenAI,迅速成為GPT圖片生成伍人核心成員之壹,負責GPT圖像生成模型的所有訓練,同時也是Sora視頻生成團隊的壹員。

在演示中,他給家鄉無錫做了壹張海報。然後為來自首爾的隊友做韓文海報,為來自Bangladesh的隊友做孟加拉語海報。每壹張中的文字渲染都精准無誤。



中科大Jianfeng Wang:讓生圖AI理解世界知識


中科大博士畢業的Jianfeng Wang,在GPT Image 2團隊負責的是另壹個讓人驚歎的能力:指令遵循和理解世界。



舊模型畫的永遠時鍾永遠指向10:10,源於網絡上的鍾表廣告圖,幾乎清壹色都是10:10。

這是因為鍾表廠商找心理學家做過實驗,認為這有助於刺激消費者買表的意願。



[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
     推薦:

    意見

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *: 
    安全校驗碼 *:  請在此處輸入圖片中的數字
    The Captcha image  (請在此處輸入圖片中的數字)



    Copyright © 溫哥華網, all rights are reserved.

    溫哥華網為北美中文網傳媒集團旗下網站