李俊成,博士,浙江大学软件学院百人计划研究员。师从庄越挺教授,于2023年6月获得浙江大学计算机科学与技术专业博士学位。同年7月赴新加坡国立大学Chua Tat-Seng院士组从事博士后研究工作。研究方向包括多模态理解、多模态生成、多模态智能体、具身智能等。近年, 以第一/通讯作者,在PAMI、NeurIPS、ICLR、ICML、CVPR等国际顶级期刊/会议发表论文28篇,曾获会议Oral/Spotlight奖励8次,带队在国际学术竞赛中获得冠军多次,并担任IJCV、NeurIPS、CVPR等期刊和会议的程序委员会委员或特邀审稿人。曾获中国图象图形学学会优秀博士学位论文奖。作为课题/任务负责人,参与科技部科技创新 2030-“新一代人工智能”、国家自然科学基金委重点项目等重大研究项目
1. 多模态理解与生成 (Unified Multimodal Comprehension and Generation)。包括多模态理解与生成统一架构、多模态思维链推理增强、可控图像生成与编辑、物理约束下的可控视频生成与编辑等研究内容。相关研究与华为中央媒体院、华为终端、字节等企业合作展开,算力资源充足。
2. 多模态数字智能体 (Multimodal Digital Agent)。包括智能体评测基准构建(步骤级、多维度、测试能力可控等)、智能体强化学习奖励模型构建、自演化学习算法、持续学习记忆模块构建等研究内容。相关研究与蚂蚁集团、中电科等企业合作展开。
3. 具身智能 (Embodied Agent)。包括策略规划、动作控制、姿态拟人、空间感知等研究内容。相关研究与宇树科技等企业合作展开,提供可定制化人形机器人与实验场地。
以上研究方向均提供具体的科研指导以及丰富的企业实习机会。