半壁華人!GPT Image 2團隊曝光 13人4個月封神
通過過自動構建互聯網規模的3D空間推理 VQA 數據集(1000 萬圖像、20 億 QA 對),為視覺語言模型賦予定量 / 定性空間推理能力,可從單張 2D 圖像輸出米制距離、尺寸、方位等精確數值。
這項研究把思維鏈空間推理應用到了具身智能領域。

在谷歌實習期間,他開發的指令微調技術後續還被Gemini 2.0采用。
他在高中參加科研夏令營時,還不懂Python的基本語法,那時結識的谷歌DeepMind資深研究員夏斐把他引入了AI世界。
夏斐兩次邀請他到DeepMind完成高質量實習,這些經歷使陳博遠積累了大規模模型訓練的工程經驗,也為他理解多模態系統的數據需求提供了寶貴視角。
博士畢業後,陳博遠於2025年6月加入OpenAI,迅速成為GPT圖片生成伍人核心成員之壹,負責GPT圖像生成模型的所有訓練,同時也是Sora視頻生成團隊的壹員。
在演示中,他給家鄉無錫做了壹張海報。然後為來自首爾的隊友做韓文海報,為來自Bangladesh的隊友做孟加拉語海報。每壹張中的文字渲染都精准無誤。

中科大Jianfeng Wang:讓生圖AI理解世界知識
中科大博士畢業的Jianfeng Wang,在GPT Image 2團隊負責的是另壹個讓人驚歎的能力:指令遵循和理解世界。

舊模型畫的永遠時鍾永遠指向10:10,源於網絡上的鍾表廣告圖,幾乎清壹色都是10:10。
這是因為鍾表廠商找心理學家做過實驗,認為這有助於刺激消費者買表的意願。

[物價飛漲的時候 這樣省錢購物很爽]
好新聞沒人評論怎麼行,我來說幾句
這項研究把思維鏈空間推理應用到了具身智能領域。

在谷歌實習期間,他開發的指令微調技術後續還被Gemini 2.0采用。
他在高中參加科研夏令營時,還不懂Python的基本語法,那時結識的谷歌DeepMind資深研究員夏斐把他引入了AI世界。
夏斐兩次邀請他到DeepMind完成高質量實習,這些經歷使陳博遠積累了大規模模型訓練的工程經驗,也為他理解多模態系統的數據需求提供了寶貴視角。
博士畢業後,陳博遠於2025年6月加入OpenAI,迅速成為GPT圖片生成伍人核心成員之壹,負責GPT圖像生成模型的所有訓練,同時也是Sora視頻生成團隊的壹員。
在演示中,他給家鄉無錫做了壹張海報。然後為來自首爾的隊友做韓文海報,為來自Bangladesh的隊友做孟加拉語海報。每壹張中的文字渲染都精准無誤。

中科大Jianfeng Wang:讓生圖AI理解世界知識
中科大博士畢業的Jianfeng Wang,在GPT Image 2團隊負責的是另壹個讓人驚歎的能力:指令遵循和理解世界。

舊模型畫的永遠時鍾永遠指向10:10,源於網絡上的鍾表廣告圖,幾乎清壹色都是10:10。
這是因為鍾表廠商找心理學家做過實驗,認為這有助於刺激消費者買表的意願。

[物價飛漲的時候 這樣省錢購物很爽]
| 分享: |
| 注: | 在此頁閱讀全文 |
推薦:
半壁華人!GPT Image 2團隊曝光 13人4個月封神