報告時間:2025年10月16日(星期四)14:40
報告地點:翡翠湖校區科教樓B501報告廳
報 告 人:鄧志杰 助理教授
工作單位:上海交通大學
舉辦單位:計算機與信息學院
報告簡介:
以自回歸模型和擴散模型為代表的多模態生成模型是當前人工智能領域的前沿熱點,不過兩類模型各有優劣和適用場景。本報告將探討二者的有機結合,主要圍繞 diffusion for AR 的思路,解決自回歸模型在連續信號建模、推理效率等方面的問題,并簡要介紹相關方法在跨模態生成、VLA 等場景的應用。
報告人簡介:
鄧志杰,于清華大學計算機系取得學士(2017)和博士(2022)學位,現任上海交通大學助理教授。主要研究生成模型,代表工作包括 D2F(首個超越自回歸模型生成速度的開源擴散語言模型)和 Orthus(最早的具有原生圖像生成能力的多模態大語言模型之一),相關技術應用于美團 LongCat、階躍星衍 NextStep 等業界大模型。
在 ICML、NeurIPS、CVPR 等會議和期刊上發表論文近 50 篇(第一/通訊作者 30 余篇),包括多篇 Spotlight。任 ICLR、CVPR 等會議領域主席,獲 NVAIL Pioneering Research Award 等。主持多項國家/省部級和 CCF 產學合作基金。