崔程
百度资深工程师
百度飞桨PaddleOCR、PaddleX等套件技术负责人。负责视觉及OCR类模型研发,参与研发飞桨PP系列模型80余个,如PP-LCNet系列、PP-OCR系列、PP-YOLO、RT-DETR系列等;参与公司内多个计算机视觉相关的项目,申请国内外专利30余项。曾获10余项国际AI竞赛金牌或冠军,其中包含多项CVPR、ICCV等workshop竞赛金牌,并受邀演讲。2024年项目“濒危物种AI守护官2.0”获2025年度爱迪生奖(爱迪生最佳新产品奖「银奖」)。
演讲主题
飞桨PaddleOCR最新技术与产业实践
围绕OCR相关的话题,介绍PaddleOCR3.0的新特性,以及这些特性如何和大模型一起,做落地应用。首先,会介绍当前OCR的现状和遇到的问题,其次,会围绕这些问题,介绍PaddleOCR 3.0(3.0-3.3版本)的新特性,这些特性包含新一代通用文字识别模型PP-OCRv5,新一代文档解析工具PP-StructureV3、新一代OCR+LLM的关键信息抽取方案PP-ChatOCRv4。接着会介绍PaddleOCR的MCP工具如何和大模型结合,成为千行百业的提效工具。最后,会介绍PaddleOCR+大模型的一个行业落地范例。 大纲: 1.OCR现状及问题 2.PaddleOCR3.0介绍 3.PaddleOCR3.0核心技术揭秘 4.PaddleOCR3.0使用方式以及产业实践