银行AI延伸性项目审核系统

技术架构与商业价值白皮书

Multi-Agent协同驱动的资本性投入智能审核平台
以AI新质生产力重塑银行科技风控范式

AI智能审核

银行科技治理

风控合规

7维AI全景审核 9步端到端自动化 50-80倍效率提升 15%+成本节约

中国建设银行 · 科技部

核心数据看板：从量变到质变的飞跃

深化风控科技，提升服务效能

≤0分钟

审核效率（工作日→分钟）

0倍

审核效率提升

0%

单项目资金节约（平均压降）

0+

自动生成简报（字数）

+0%

极端价格偏离识别

0层

Multi-Agent协同架构

审核维度

7维

流水线步骤

9步

信创厂商白名单

20+

政采数据

实时对接

开篇 · 战略定位与时代背景

以AI新质生产力驱动
银行科技治理现代化

政策引领

落实《数字中国建设整体布局规划》，驱动治理方式数字化变革。

金融使命

贯彻中央金融工作会议精神，做好"五篇大文章"中的数字金融。

监管要求

遵循数字化转型指导意见，实现从"经验驱动"向"智能驱动"转变。

范式跃迁：

实现从传统人工审核到AI Agent自主决策审核的跨代演进。本系统正是在这一时代背景下应运而生的前沿探索。

系统的诞生响应了国家对数字金融和智能风控的战略要求，是治理现代化的必然选择。

行业挑战

行业痛点：延伸性项目审核的困境

银行延伸性项目——涵盖医院、高校、政务、企业信息化等领域——的审核长期面临以下结构性挑战：

1

效率瓶颈

年均审核数百项目，涉及数亿元资金，每个项目需3-5个工作日，人工处理力不从心。

2

标准缺失

审核质量高度依赖个人经验，不同审核员的判断标准存在显著差异，质量参差不齐。

3

数据孤岛

历史价格分散在各类文档中，缺乏系统化的比价数据库，市场数据获取依赖人工搜索。

4

合规风险

信创国产化、金融属性判定等复杂维度极易被人工审核遗漏。

5

量化缺失

价格偏离、重复投资等风险缺乏精准的量化评估手段，风险暴露往往事后才被发现。

6

行业现状

国内目前尚无针对银行延伸性项目的AI Agent自主审核系统，处于技术空白。

本系统的建设填补了这一领域的空白，具有行业首创意义

第一章 · 核心技术创新

架构创新：Multi-Agent协同审核范式

从"被动规则匹配"到"主动智能审核"的质变

感知层

数据清洗Agent

多格式文档智能解析，将非结构化Excel/PDF/Word自动转化为结构化审核数据

MarkItDown LLM结构化提取 7字段

认知层

市场检索Agent

自主决策的搜索-抓取-提取循环，从互联网实时获取市场基准数据

Pydantic AI Agent 博查搜索API Reranker重排

决策层

审核决策Agent

7维度量化风险评估 + 标准化审核报告自动生成

Pydantic结构化输出 Instructor强制校验

层级	Agent类型	核心能力	技术实现
感知层	数据清洗Agent	多格式文档智能解析，将非结构化Excel/PDF/Word自动转化为结构化审核数据	MarkItDown多格式转换 + LLM结构化提取（7字段）
认知层	市场检索Agent	自主决策的搜索-抓取-提取循环，从互联网实时获取市场基准数据	Pydantic AI Agent + 博查搜索API + Reranker重排
决策层	审核决策Agent	7维度量化风险评估 + 标准化审核报告自动生成	Pydantic结构化输出 + Instructor强制校验

九步流水线编排器

1

→

2

→

3

→

4

→

5

→

6

→

7

→

8

→

9

三层Agent之间通过九步流水线编排器协同工作：感知层完成数据结构化后，认知层主动获取外部参照数据，最终决策层综合内外部信息做出量化风险评估。整个过程无需人工干预，实现了端到端的自主审核闭环。

市场检索Agent：自主决策循环

最具专利价值和技术壁垒的创新

1

自主查询规划

LLM将模糊需求拆解为10-18条精准搜索查询

2

自主工具调用循环

Agent自主决定何时搜索、何时抓取，最多8轮

3

智能信息提取

并发抓取网页，LLM提取结构化招投标记录

4

自主降级容错

结果不足时自动激活降级策略，二次提取

5

多重后处理

去重 → 预算过滤 → 时间过滤 → Reranker语义重排

循环核心

8轮

自主迭代（最多）

侧信道通信优化

75%

Token节省，彻底解决长文本下的性能退化

业务价值：如同一位不知疲倦的采购情报分析师，能在数分钟内自主完成数十次互联网搜索、数百个网页的智能解读。

七维度AI全景审核引擎

覆盖价格、合规、投资逻辑的全方位评估

维度	审核关键内容	AI核心赋能
价格合理性	基准价推导	0-100量化风险评分
金融属性	业务属性判定	28个正负向锚点识别
信创合规	国产化扫描	20+厂商名单自动扫描
投入合理性	历史投入对比	跨期次趋势分析
软件重复性	功能重叠检测	24个领域关键词+语义判断
相似度匹配	同类项目检索	1024维向量余弦相似度
市场基准	政府采购比价	AI Agent全网搜索提取

关键创新 — 结构化输出防幻觉机制：每条审核意见均通过Pydantic结构化输出 + Instructor强制校验，包含完整reasoning_process推理链，杜绝大语言模型幻觉导致的审核误判。

向量语义匹配引擎 — "理解"而非"匹配"

突破关键词局限，深度洞察项目本质

模型：BAAI/bge-large-zh-v1.5

维度：1024维中文语义向量

存储：PostgreSQL pgvector

1

第一阶段：粗筛

Coarse Filtering

基于名称向量的余弦相似度，从全库中快速检索

Top-50 候选项

2

第二阶段：精排

Fine Ranking

名称向量 + 规格向量按 50:50 权重融合精排

Top-K 最终结果

语义理解示例 — 系统能"理解"而非简单"匹配"：

智慧财务系统 ≈ 财务管理平台 | 数据中台 ≈ 大数据平台

九步全自动审核流水线

工业级工程创新，打造稳定高效的生产线

1 数据清洗 8%

→

2 历史数据清洗 8%

→

3 向量生成 8%

→

4 相似度匹配 20%

→

5 价格审核 15%

→

6 扩展审核 15%

→

7 金融属性审核 10%

→

8 简报生成 10%

→

9 报告生成 6%

断点续跑

任意步骤失败后可从该步骤恢复执行，无需重头运行

SSE实时监控

前端三面板沉浸式执行监控：流水线图+实时日志+数据预览

任务可取消

运行中的任务支持随时取消，立即释放系统资源

权重化进度

根据每步计算复杂度分配权重，进度条精准反映真实进度

企业级高并发与金融级精度

强韧性架构支撑大规模生产环境

金融级精度保障

Decimal(16,6)

全部金融字段精确运算，杜绝浮点数舍入误差

并发控制

32路LLM异步信号量控制，兼顾吞吐与API限速保护

高可用性

支持多主流LLM服务商热切换，确保服务不间断

异常防护

7次指数退避重试 + 600秒超时保护，确保任务韧性

安全合规

本地化数据库存储，全链路日志留痕，满足监管要求

银行科技治理的战略定位

解决科技治理"最后一公里"的AI化方案

主动风控模式

从"被动等待申报"转向"AI主动检索与预警"

角色定位

连接银行科技部与外部合作机构的关键管控节点

专家放大器

解决资深审核专家稀缺问题，实现专家经验的规模化复制

数据资产化

通过项目审核积累，构建全行统一的科技投资知识图谱

治理升级

提升银行在延伸项目中的话语权，实现精细化资本性投入管理

六大传统痛点的AI破解方案

用AI打破僵局：全行统一、数据联动、智能还原、标准一致、合规无死角、资源优化

传统痛点	AI解决方案	战略价值
价格数据孤岛	向量语义匹配 + 互联网实时检索双通道比价	构建全行统一的价格基准数据资产
无市场基准	AI Agent自主检索政府采购网 / 公共资源交易平台	实现与政府公共数据的实时联动
历史投入遗忘	多期次历史文件LLM清洗 + 投资脉络叙事生成	形成项目全生命周期投资画像
报告质量参差	标准化AI报告自动生成（25K+字简报 + 8K+ token正式材料）	全行审核输出标准统一
信创合规盲区	20+国产厂商白名单 / 黑名单自动扫描	切实落实国家信创战略要求
软件重复投入	24个软件领域关键词 + LLM语义重叠检测	避免重复投资，保护国有资产

实证案例：南华大学智慧校园项目

助力预算直接节约约202.5万元

0

总投资（万元）

0

审核条目（个）

0

节约金额（万元）

0

审核简报字数

投资构成分析

硬件4项 · 软件6项 · 费用4项 — 共14个条目

AI发现： 4项偏高（最高+184.7%）、2项偏低、8项合理

历史追溯： 2015-2019四期投入2,484.54万元

输出报告： 25,600+字审核简报 + 8,000+ token正式报告

预算压降约15%，节约约202.5万元

总投资1,350.00万元 → 经AI审核后有效压降，直接节约国有资金

S5 · 风险避免与质量管控

AI幻觉防控
金融审核的生命线

4

第四重 — 推理留痕

强制要求 reasoning_process 字段，记录AI每一阶段的逻辑依据

3

第三重 — 量化替代

用 0–100 精确风险分值替代"可能""大概"等模糊表述

2

第二重 — 源头注入

Instructor 库将 JSON Schema 注入 Prompt，约束 LLM 生成逻辑

1

第一重 — 结构约束

Pydantic 模型强制校验字段类型、值域与必填项

技术成果：彻底杜绝AI胡言乱语，使审核结论具备法律级的可追溯性。

信创/国产化
合规自动审核

信创审信创

系统自身也信创兼容
实现审核闭环

战略意义：系统自身也信创兼容，实现"信创审信创"闭环

白名单（国产化合规）

CPU

鲲鹏(华为) 飞腾龙芯兆芯海光

GPU

昇腾摩尔线程壁仞

操作系统

银河麒麟统信UOS 鸿蒙

数据库

达梦人大金仓 GaussDB OceanBase TDSQL

黑名单（非信创产品）

Intel (CPU) AMD (CPU) NVIDIA (GPU) Windows Server

输出结论三级判定

合规不合规不适用

金融属性管控

防漏判铁律

"凡涉及支付、结算功能的系统，即使项目名称中不包含金融关键词，也必须判定为有金融属性"

16个正向锚点

财务管理系统支付结算平台医保系统对账系统资金管理平台电子银行系统信贷管理系统风控平台反洗钱系统清算系统银企直连平台国库集中支付代收代付系统预算管理平台票据管理系统交易监控平台

12个负向标记

机房建设装修工程弱电施工空调暖通消防工程安防监控综合布线 UPS电源防雷接地门禁系统物业管理办公家具

数据完整性与全链路审计

每一步操作皆有据可查，每一项决策皆可追溯

五重数据保障体系

JSONB审计链

7个审核维度的结果分别存储在独立的JSONB列中，每条记录附带时间戳，支持完整审计追溯。

层级异常体系

InputError · LLMError · WorkflowError 三级分类，杜绝静默失败。

幂等写入保护

采用 ON CONFLICT DO UPDATE 模式，确保同一条目审核结果不因重试产生重复记录。

StepLog全链路日志

9步流水线每步产生结构化日志（步骤号、级别、消息、条目ID、时间戳），完整入库并通过SSE实时推送。

异步事务保护

基于Python异步上下文管理器，任何异常自动触发数据库事务回滚，确保数据一致性不受LLM调用失败影响。

多源数据交叉验证

四重清洗漏斗

去重 → 预算过滤(±50%) → 时间过滤(5年) → 语义重排

双通道比价

●行内历史向量匹配
●AI Agent 互联网实时检索

双表验证

●固定资产库分类匹配
●采购记录库分类匹配

可信优先

●12类政府/官方域名优先
●66个商业噪声域名自动屏蔽

时间效率的革命性提升

从"天"级到"分钟"级的跨代效率飞跃

0-80倍

核心提升倍数

审核环节	传统人工模式	AI Agent模式	效率提升
单项目完整审核周期	3-5个工作日	≤30分钟	50-80倍
市场比价数据收集	2-4小时/条目	数分钟（Agent自主）	20-50倍
审核报告撰写	1-2天/份	实时自动生成	即时输出
年处理项目容量	50-80个（3-5人团队）	不受人力约束	弹性无限

直接资金保障价值

守护国有资产，实现投入效用最大化

0万元

年化资金保障可达

实测数据

单个智慧校园项目即实现202.5万元资金节约

保守推算

全行年审50个项目，年化资金保障约1,500万元

积极推算

年审100个项目，年化资金保障可达1.2亿元

极端风险拦截

成功检出偏离度184%的报价，单笔避免损失35.75万元

推算场景	年审核项目数	项目平均投资	平均节约率	年化资金保障
保守估计	50个	1,000万	3%	1,500万元
中等估计	100个	1,000万	5%	5,000万元
积极估计	100个	1,500万	8%	12,000万元

人力成本优化与人才价值释放

从重复劳动转向战略评审的高质量演进

传统模式

3-5人专业团队

AI协同模式

+

1名操作员 + AI Agent

预估年化人力成本节约

75-200万元

团队精简

传统3-5人专业团队 → 1名操作员+AI Agent协同，大幅降低人力投入

人力成本节约

预估年化节约75-200万元，释放宝贵的专家资源

专家角色转型

将资深专家从数据填表中解放，聚焦战略级评审与决策咨询

知识传承

系统自动固化专家审核经验，不因人员流动导致能力下降

效能提升

同样的编制下，科技审核的深度和覆盖面实现数倍扩张

错误规避的隐性价值

有效收窄风险敞口，实现合规经营

1

降低漏审率

减少人工在软件重复、信创合规方面15%-25%的漏审风险

2

全维度覆盖

AI不知疲倦地执行7个维度检查，确保审核尺度零漂移

3

防御能力

自动识别虚假低价投标、捆绑销售等隐蔽的价格陷阱

4

品牌价值

提升银行在监管机构心目中的科技风控标杆形象

5

风险防范

将潜在的审计风险、合规风险消灭在立项审核阶段

全行推广路径：从试点到中枢

分阶段实现银行科技治理的全面AI化

1 3-6个月

分行试点

选择2-3家省分行试点，积累首批价格基准数据

2 6-12个月

区域推广

跨分行数据共享，构建"投资知识图谱"

3 12-18个月

总行部署

全行统一部署，AI能力随数据持续进化

环境变量配置化多LLM提供商热切换行业自动识别（医院/高校/政务/金融/政法）

横向复用：AI Agent能力的无限可能

核心技术能力在多元金融场景的迁移应用

AI Agent
核心能力

向量匹配 · 多源融合 · 结构化评分 · 智能检索 · 流水线编排

信贷审批辅助

复用向量匹配与评分能力，自动量化信贷风险

反洗钱(AML)辅助

复用Agent搜索+多源数据融合，企业关联分析

智能客服质检

复用结构化评分矩阵，0-100量化质检评分

供应商尽职调查

复用互联网检索Agent，构建供应商全景画像

内部审计自动化

复用九步流水线架构，扩展审计场景

技术壁垒与知识产权价值

科技自主，构建核心竞争力

发明专利一

AI Agent自主决策循环

基于AI Agent自主决策循环的招投标信息智能检索方法

发明专利二

结构化输出校验防控

基于结构化输出校验的大语言模型审核幻觉防控方法

发明专利三

两阶段向量融合匹配

基于两阶段向量融合的资本性投入项目智能匹配方法

软件著作权

银行AI延伸性项目智能审核系统 V1.0

附录A：系统技术参数速查表

参数类别	参数名称	参数值
流水线	审核步骤数	9步
审核	审核维度数	7维
文档	支持文件格式	7种(.xlsx/.xls/.csv/.docx/.doc/.pdf/.html)
向量	向量维度	1024维
向量	语义模型	BAAI/bge-large-zh-v1.5
并发	LLM并发上限	32路
并发	Embedding批处理	100条/批 × 8路并发
并发	网页抓取并发	8路
风控	风险评分范围	0-100分
检索	预算容差范围	±50%
检索	时间窗口	近5年
检索	噪声域名黑名单	66个
检索	可信域名白名单	12类
韧性	LLM重试机制	7次指数退避
韧性	超时保护	600秒
精度	金融字段精度	Decimal(16,6)
LLM	提供商支持	3+(SiliconFlow/OpenAI/阿里云)
数据库	核心数据表	8张

附录B：系统架构全景图

UI层

Next.js 16 + React 19 + TypeScript + Tailwind CSS v4

审核工作台 3步任务向导 3面板执行监控 7维审核报告

API网关层

FastAPI

任务管理文件上传流水线控制进度推送报告查询

Agent层

九步Pipeline顺序执行编排

感知层Agent（数据清洗）认知层Agent（市场检索）决策层Agent（审核决策）

数据层

PostgreSQL + pgvector（1024维）

JSONB Decimal ON CONFLICT