Multi-Agent协同驱动的资本性投入智能审核平台
以AI新质生产力重塑银行科技风控范式
深化风控科技,提升服务效能
开篇 · 战略定位与时代背景
落实《数字中国建设整体布局规划》,驱动治理方式数字化变革。
贯彻中央金融工作会议精神,做好"五篇大文章"中的数字金融。
遵循数字化转型指导意见,实现从"经验驱动"向"智能驱动"转变。
实现从传统人工审核到AI Agent自主决策审核的跨代演进。本系统正是在这一时代背景下应运而生的前沿探索。
系统的诞生响应了国家对数字金融和智能风控的战略要求,是治理现代化的必然选择。
行业挑战
银行延伸性项目——涵盖医院、高校、政务、企业信息化等领域——的审核长期面临以下结构性挑战:
年均审核数百项目,涉及数亿元资金,每个项目需3-5个工作日,人工处理力不从心。
审核质量高度依赖个人经验,不同审核员的判断标准存在显著差异,质量参差不齐。
历史价格分散在各类文档中,缺乏系统化的比价数据库,市场数据获取依赖人工搜索。
信创国产化、金融属性判定等复杂维度极易被人工审核遗漏。
价格偏离、重复投资等风险缺乏精准的量化评估手段,风险暴露往往事后才被发现。
国内目前尚无针对银行延伸性项目的AI Agent自主审核系统,处于技术空白。
本系统的建设填补了这一领域的空白,具有行业首创意义
第一章 · 核心技术创新
从"被动规则匹配"到"主动智能审核"的质变
感知层
多格式文档智能解析,将非结构化Excel/PDF/Word自动转化为结构化审核数据
认知层
自主决策的搜索-抓取-提取循环,从互联网实时获取市场基准数据
决策层
7维度量化风险评估 + 标准化审核报告自动生成
| 层级 | Agent类型 | 核心能力 | 技术实现 |
|---|---|---|---|
| 感知层 | 数据清洗Agent | 多格式文档智能解析,将非结构化Excel/PDF/Word自动转化为结构化审核数据 | MarkItDown多格式转换 + LLM结构化提取(7字段) |
| 认知层 | 市场检索Agent | 自主决策的搜索-抓取-提取循环,从互联网实时获取市场基准数据 | Pydantic AI Agent + 博查搜索API + Reranker重排 |
| 决策层 | 审核决策Agent | 7维度量化风险评估 + 标准化审核报告自动生成 | Pydantic结构化输出 + Instructor强制校验 |
九步流水线编排器
三层Agent之间通过九步流水线编排器协同工作:感知层完成数据结构化后,认知层主动获取外部参照数据,最终决策层综合内外部信息做出量化风险评估。整个过程无需人工干预,实现了端到端的自主审核闭环。
最具专利价值和技术壁垒的创新
LLM将模糊需求拆解为10-18条精准搜索查询
Agent自主决定何时搜索、何时抓取,最多8轮
并发抓取网页,LLM提取结构化招投标记录
结果不足时自动激活降级策略,二次提取
去重 → 预算过滤 → 时间过滤 → Reranker语义重排
循环核心
自主迭代(最多)
侧信道通信优化
Token节省,彻底解决长文本下的性能退化
业务价值:如同一位不知疲倦的采购情报分析师,能在数分钟内自主完成数十次互联网搜索、数百个网页的智能解读。
覆盖价格、合规、投资逻辑的全方位评估
| 维度 | 审核关键内容 | AI核心赋能 |
|---|---|---|
| 价格合理性 | 基准价推导 | 0-100量化风险评分 |
| 金融属性 | 业务属性判定 | 28个正负向锚点识别 |
| 信创合规 | 国产化扫描 | 20+厂商名单自动扫描 |
| 投入合理性 | 历史投入对比 | 跨期次趋势分析 |
| 软件重复性 | 功能重叠检测 | 24个领域关键词+语义判断 |
| 相似度匹配 | 同类项目检索 | 1024维向量余弦相似度 |
| 市场基准 | 政府采购比价 | AI Agent全网搜索提取 |
关键创新 — 结构化输出防幻觉机制:每条审核意见均通过Pydantic结构化输出 + Instructor强制校验,包含完整reasoning_process推理链,杜绝大语言模型幻觉导致的审核误判。
突破关键词局限,深度洞察项目本质
Coarse Filtering
基于名称向量的余弦相似度,从全库中快速检索
Fine Ranking
名称向量 + 规格向量按 50:50 权重融合精排
语义理解示例 — 系统能"理解"而非简单"匹配":
工业级工程创新,打造稳定高效的生产线
任意步骤失败后可从该步骤恢复执行,无需重头运行
前端三面板沉浸式执行监控:流水线图+实时日志+数据预览
运行中的任务支持随时取消,立即释放系统资源
根据每步计算复杂度分配权重,进度条精准反映真实进度
强韧性架构支撑大规模生产环境
金融级精度保障
全部金融字段精确运算,杜绝浮点数舍入误差
32路LLM异步信号量控制,兼顾吞吐与API限速保护
支持多主流LLM服务商热切换,确保服务不间断
7次指数退避重试 + 600秒超时保护,确保任务韧性
本地化数据库存储,全链路日志留痕,满足监管要求
解决科技治理"最后一公里"的AI化方案
从"被动等待申报"转向"AI主动检索与预警"
连接银行科技部与外部合作机构的关键管控节点
解决资深审核专家稀缺问题,实现专家经验的规模化复制
通过项目审核积累,构建全行统一的科技投资知识图谱
提升银行在延伸项目中的话语权,实现精细化资本性投入管理
用AI打破僵局:全行统一、数据联动、智能还原、标准一致、合规无死角、资源优化
| 传统痛点 | AI解决方案 | 战略价值 |
|---|---|---|
| 价格数据孤岛 | 向量语义匹配 + 互联网实时检索双通道比价 | 构建全行统一的价格基准数据资产 |
| 无市场基准 | AI Agent自主检索政府采购网 / 公共资源交易平台 | 实现与政府公共数据的实时联动 |
| 历史投入遗忘 | 多期次历史文件LLM清洗 + 投资脉络叙事生成 | 形成项目全生命周期投资画像 |
| 报告质量参差 | 标准化AI报告自动生成(25K+字简报 + 8K+ token正式材料) | 全行审核输出标准统一 |
| 信创合规盲区 | 20+国产厂商白名单 / 黑名单自动扫描 | 切实落实国家信创战略要求 |
| 软件重复投入 | 24个软件领域关键词 + LLM语义重叠检测 | 避免重复投资,保护国有资产 |
助力预算直接节约约202.5万元
硬件4项 · 软件6项 · 费用4项 — 共14个条目
总投资1,350.00万元 → 经AI审核后有效压降,直接节约国有资金
S5 · 风险避免与质量管控
强制要求 reasoning_process 字段,记录AI每一阶段的逻辑依据
用 0–100 精确风险分值替代"可能""大概"等模糊表述
Instructor 库将 JSON Schema 注入 Prompt,约束 LLM 生成逻辑
Pydantic 模型强制校验字段类型、值域与必填项
技术成果:彻底杜绝AI胡言乱语,使审核结论具备法律级的可追溯性。
系统自身也信创兼容
实现审核闭环
战略意义:系统自身也信创兼容,实现"信创审信创"闭环
"凡涉及支付、结算功能的系统,即使项目名称中不包含金融关键词,也必须判定为有金融属性"
每一步操作皆有据可查,每一项决策皆可追溯
7个审核维度的结果分别存储在独立的JSONB列中,每条记录附带时间戳,支持完整审计追溯。
InputError · LLMError · WorkflowError 三级分类,杜绝静默失败。
采用 ON CONFLICT DO UPDATE 模式,确保同一条目审核结果不因重试产生重复记录。
9步流水线每步产生结构化日志(步骤号、级别、消息、条目ID、时间戳),完整入库并通过SSE实时推送。
基于Python异步上下文管理器,任何异常自动触发数据库事务回滚,确保数据一致性不受LLM调用失败影响。
去重 → 预算过滤(±50%) → 时间过滤(5年) → 语义重排
从"天"级到"分钟"级的跨代效率飞跃
核心提升倍数
| 审核环节 | 传统人工模式 | AI Agent模式 | 效率提升 |
|---|---|---|---|
| 单项目完整审核周期 | 3-5个工作日 | ≤30分钟 | 50-80倍 |
| 市场比价数据收集 | 2-4小时/条目 | 数分钟(Agent自主) | 20-50倍 |
| 审核报告撰写 | 1-2天/份 | 实时自动生成 | 即时输出 |
| 年处理项目容量 | 50-80个(3-5人团队) | 不受人力约束 | 弹性无限 |
守护国有资产,实现投入效用最大化
年化资金保障可达
单个智慧校园项目即实现202.5万元资金节约
全行年审50个项目,年化资金保障约1,500万元
年审100个项目,年化资金保障可达1.2亿元
成功检出偏离度184%的报价,单笔避免损失35.75万元
| 推算场景 | 年审核项目数 | 项目平均投资 | 平均节约率 | 年化资金保障 |
|---|---|---|---|---|
| 保守估计 | 50个 | 1,000万 | 3% | 1,500万元 |
| 中等估计 | 100个 | 1,000万 | 5% | 5,000万元 |
| 积极估计 | 100个 | 1,500万 | 8% | 12,000万元 |
从重复劳动转向战略评审的高质量演进
传统模式
3-5人专业团队
AI协同模式
1名操作员 + AI Agent
预估年化人力成本节约
75-200万元
传统3-5人专业团队 → 1名操作员+AI Agent协同,大幅降低人力投入
预估年化节约75-200万元,释放宝贵的专家资源
将资深专家从数据填表中解放,聚焦战略级评审与决策咨询
系统自动固化专家审核经验,不因人员流动导致能力下降
同样的编制下,科技审核的深度和覆盖面实现数倍扩张
有效收窄风险敞口,实现合规经营
减少人工在软件重复、信创合规方面15%-25%的漏审风险
AI不知疲倦地执行7个维度检查,确保审核尺度零漂移
自动识别虚假低价投标、捆绑销售等隐蔽的价格陷阱
提升银行在监管机构心目中的科技风控标杆形象
将潜在的审计风险、合规风险消灭在立项审核阶段
分阶段实现银行科技治理的全面AI化
选择2-3家省分行试点,积累首批价格基准数据
跨分行数据共享,构建"投资知识图谱"
全行统一部署,AI能力随数据持续进化
核心技术能力在多元金融场景的迁移应用
向量匹配 · 多源融合 · 结构化评分 · 智能检索 · 流水线编排
复用向量匹配与评分能力,自动量化信贷风险
复用Agent搜索+多源数据融合,企业关联分析
复用结构化评分矩阵,0-100量化质检评分
复用互联网检索Agent,构建供应商全景画像
复用九步流水线架构,扩展审计场景
科技自主,构建核心竞争力
基于AI Agent自主决策循环的招投标信息智能检索方法
基于结构化输出校验的大语言模型审核幻觉防控方法
基于两阶段向量融合的资本性投入项目智能匹配方法
| 参数类别 | 参数名称 | 参数值 |
|---|---|---|
| 流水线 | 审核步骤数 | 9步 |
| 审核 | 审核维度数 | 7维 |
| 文档 | 支持文件格式 | 7种(.xlsx/.xls/.csv/.docx/.doc/.pdf/.html) |
| 向量 | 向量维度 | 1024维 |
| 向量 | 语义模型 | BAAI/bge-large-zh-v1.5 |
| 并发 | LLM并发上限 | 32路 |
| 并发 | Embedding批处理 | 100条/批 × 8路并发 |
| 并发 | 网页抓取并发 | 8路 |
| 风控 | 风险评分范围 | 0-100分 |
| 检索 | 预算容差范围 | ±50% |
| 检索 | 时间窗口 | 近5年 |
| 检索 | 噪声域名黑名单 | 66个 |
| 检索 | 可信域名白名单 | 12类 |
| 韧性 | LLM重试机制 | 7次指数退避 |
| 韧性 | 超时保护 | 600秒 |
| 精度 | 金融字段精度 | Decimal(16,6) |
| LLM | 提供商支持 | 3+(SiliconFlow/OpenAI/阿里云) |
| 数据库 | 核心数据表 | 8张 |
Next.js 16 + React 19 + TypeScript + Tailwind CSS v4
FastAPI
九步Pipeline顺序执行编排
PostgreSQL + pgvector(1024维)
银行AI延伸性项目智能审核系统 V1.0
中国建设银行 · 科技部
本白皮书基于系统实际源码和真实测试数据编制