免费领取大会全套演讲PPT    

点击领取

我要参会

薛涛锋

美团Staff Engineer

薛涛锋,美团Staff Engineer,硕士毕业于中国科学院软件研究所,曾作为“北斗”计划顶尖人才加入美团。在大模型与自主智能体前沿领域,他以第一作者身份主导了业内领先的 EvoCUA (Evolving Computer Use Agents) 项目,该成果以 56.7% 的成功率在2026年1月登顶 OSWorld 开源榜首,模型全面开源后下载量迅速突破 12K+,技术报告荣登 HuggingFace Daily Paper 榜首。在深耕基座创新之前,他拥有逾 5 年的大规模搜广推系统实战经验,历任美团点评社区搜索 Ranking 负责人。兼具前沿学术视野与顶尖工程落地能力的他,曾率队斩获 ICCV 2025 多模态推理冠军、RecSys Challenge 2024多模态推荐全球亚军,并在ICCV、RecSys、SIGIR、CIKM等顶级会议发表多篇论文。此外,他还是拥有逾 5 万专业粉丝的知名技术博主「蘑菇先生」,持续为行业开源社区输出高价值的AI 技术洞察。

演讲主题

迈向数字生命:Computer Use Agent (EvoCUA) 的核心技术与自进化实践

让 AI 像人类一样通过视觉感知屏幕、操作键鼠并自主完成跨应用长链路计算机任务(Computer Use Agent),是大模型向“数字生命”演进的关键里程碑。然而,当前行业普遍面临数据合成质量低、缺乏交互反馈与长链路信用分配难等落地挑战。 本次分享将深度拆解由我主导并成功开源的 EvoCUA 项目,分享我们在算法与Infra侧的经验: ①可验证数据合成:构建“生成即验证”的 Agentic 引擎,实现高质量全场景任务 Scaling。 ②十万级沙盒基建:突破基础设施瓶颈,分钟级拉起万级沙盒,支撑高并发交互探索。 ③经验进化学习:打通冷启动结构化思维、RFT 动态去噪与 RL 关键点反思,让模型真正学会“从失败中进化”。 EvoCUA 于2026.1全面开源,在 OSWorld权威基准上以 56.7% 的成功率大幅刷新开源 SOTA,模型下载量迅速突破 12K+,技术报告荣登 HuggingFace Daily Paper 榜首 (2026.01.23)。希望通过本次从底层基建到算法范式的全链路拆解,为行业在多模态大模型 Agent 落地方面提供高价值的实战借鉴。

© boolan.com 博览 版权所有

沪ICP备15014563号-6

沪公网安备31011502003949号