何斌 | 2026奇点智能技术大会-4月

免费领取《AI原生软件研发成熟度模型 AISMM》白皮书

点击领取

我要参会

何斌

Omni-Infer模型性能优化负责人，华为研发工程师

Omni-Infer模型性能优化负责人，MTP SIG committer。毕业于中国科学技术大学和中国科学院大学，加入华为后先后在计算机网络和AI infra领域工作十年，拥有丰富的大模型推理优化工程经验。深度参与了多个开源模型以及盘古大模型在昇腾平台上的性能优化，应用于高性能推理服务和RL rollout。

演讲主题

Omni-Infer性能极致优化实践

Omni-Infer是一套专为昇腾硬件平台定制的强大推理加速工具集，本议题介绍Omni-Infer语言大模型和多模态大模型上在高吞吐和低时延方面进行极致性能优化的实践探索，包括融合算子、多流并行、调度和投机等。大纲： 1.背景 2.高吞吐与低时延优化实践案例 3.未来展望

Boolan 秉承“全球专家，连接智慧”的宗旨，通过汇聚全球顶尖IT技术专家，致力于为广大企业用户提供高端IT技术和产品领域的技术咨询、技术会议、企业内训、专家讲座、研讨会、测评认证等服务。

Boolan公众号

扫一扫，获取大会最新内容

沪ICP备15014563号-6