(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211225871.4
(22)申请日 2022.10.09
(71)申请人 中国工商银行股份有限公司
地址 100140 北京市西城区复兴门内大街
55号
(72)发明人 尹少聪 胡幸 黄萱 谭洋
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 田勇 任默闻
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 40/04(2012.01)
G06Q 40/02(2012.01)
(54)发明名称
风险数据的识别方法及装置
(57)摘要
本申请提供了一种风险数据的识别方法及
装置, 可用于 数据处理技术领域, 该方法包括: 对
非风险数据进行主成分分析, 根据所述非风险数
据中的原始成分数据生成主成分数据, 其中, 所
述主成分数据的维度大于1并且小于所述原始成
分数据的维度, 各维度的主成分数据相互独立;
通过多变量控制图对所述主成分数据进行处理,
生成判断区间; 以及根据所述判断区间, 对待检
测数据进行风险识别。 通过本申请实施例, 能够
提高风险数据的识别的准确性。 本申请可用于金
融领域或其 他领域。
权利要求书1页 说明书10页 附图3页
CN 115409425 A
2022.11.29
CN 115409425 A
1.一种风险数据的识别方法, 其特 征在于, 所述方法包括:
对非风险数据进行主成分分析, 根据 所述非风险数据中的原始成分数据生成主成分数
据, 其中, 所述主成分数据的维度大于1并且小于所述原始成分数据的维度, 各维度的主成
分数据相互独立;
通过多变量控制图对所述主成分数据进行处 理, 生成判断区间; 以及
根据所述判断区间, 对待检测数据进行风险识别。
2.根据权利要求1所述的方法, 其特 征在于,
所述主成分数据为从所述原始成分数据中选出的第一成分数据分别以各自的加权系
数加权后生成的线性组合; 并且/或者,
所述主成分数据按照预设规则排序后, 被输入到所述多变量控制图。
3.根据权利要求2所述的方法, 其特 征在于, 所述主成分数据按照预设规则排序包括:
计算所述主成分数据的得分, 所述得分与 所述第一成分数据的贡献率以及所述加权系
数相关; 以及
按照得分由小到大的顺序, 对所述主成分数据进行排序。
4.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
在满足预设条件的情况 下, 对所述判断区间进行 更新。
5.根据权利要求 4所述的方法, 其特 征在于,
所述预设条件包括自上一 次更新所述判断区间起经过预设时间, 和/或, 自上一次更新
所述判断区间起检测了预设数量的待检测数据。
6.根据权利要求1所述的方法, 其特征在于, 根据所述判断区间, 对待检测数据进行风
险识别包括:
对所述待检测数据进行主成分分析, 生成所述待检测数据的主成分数据, 通过多变量
控制图对所述待检测数据的主成分数据进行处 理, 生成统计值; 以及
根据所述统计值和所述判断区间, 对所述待检测数据进行风险识别。
7.一种风险数据的识别装置, 其特 征在于, 所述装置包括:
分析单元, 其对非风险数据进行主成分分析, 根据所述非风险数据中的原始成分数据
生成主成分数据, 其中, 所述主成分数据的维度大于1并且小于所述原始成分数据的维度,
各维度的主成分数据相互独立;
生成单元, 其通过多变量控制图对所述主成分数据进行处 理, 生成判断区间; 以及
确定单元, 其根据所述判断区间, 对待检测数据进行风险识别。
8.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至6任一项所述
的方法。
9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程
序, 所述计算机程序被处 理器执行时实现权利要求1至 6任一项所述的方法。
10.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序, 所述计
算机程序被处 理器执行时实现权利要求1至 6任一项所述的方法。权 利 要 求 书 1/1 页
2
CN 115409425 A
2风险数据的识别方 法及装置
技术领域
[0001]本申请涉及数据处 理技术领域, 尤其涉及一种风险数据的识别方法及装置 。
背景技术
[0002]操作风险历来是银行业面临的主要风险之一, 受到了银行业界的高度关注。 近年
来, 随着银行机构越来越庞大, 产品愈加多样化和复杂化, 加上金融业和金融市场的全球化
趋势, 由操作风险而引起的金融案件给 银行带来了巨大的损失。
[0003]操作风险控制能力是决定业务健康发展的一个重要因素。 目前, 针对形式多变的
操作风险, 银行基本都着 手建立了各自的风险监控系统。 其中, 一种方式是通过预警规则加
强欺诈侦别能力, 来防范操作风险。 但是, 这种方式的预警规则依赖于专家经验, 因此, 在某
种程度上会受到专家主观性的影响, 存在滞后性、 迭代缓慢和阈值容易侦探等特点。 另一种
方式是利用单变量的Shewhart图确 定预警规则。 但是, 这种方式不能考虑风险因素的多元
化, 无法准确地进行风险数据的识别。
[0004]本部分旨在 为权利要求书中陈述的本申请实施例提供背景或上下文。 此处的描述
不因为包括在本 部分中就承认是现有技 术。
发明内容
[0005]为了解决上述问题中的至少一个, 本申请实施例提供一种风险数据的识别方法及
装置, 用以提高风险数据的识别的准确性。
[0006]根据本申请的实施例, 提供一种风险数据的识别方法, 其中, 该 方法包括:
[0007]对非风险数据进行主成分分析, 根据所述非风险数据中的原始成分数据生成主 成
分数据, 其中, 所述主成分数据的维度大于1并且小于所述原始成分数据的维度, 各维度的
主成分数据相互独立;
[0008]通过多变量控制图对所述主成分数据进行处 理, 生成判断区间; 以及
[0009]根据所述判断区间, 对待检测数据进行风险识别。
[0010]在一个或多个实施例中, 所述主成分数据为从所述原始成分数据中选出的第一成
分数据分别以各自的加权系数加权后生成的线性组合。
[0011]在一个或多个实施例中, 所述主成分数据按照预设规则排序后, 被输入到所述多
变量控制图。
[0012]在一个或多个实施例中, 主成分数据按照预设规则排序包括:
[0013]计算所述主成分数据的得分, 所述得分与所述第一成分数据的贡献率以及所述加
权系数有关; 以及
[0014]按照得分由小到大的顺序, 对所述主成分数据进行排序。
[0015]在一个或多个实施例中, 所述方法还 包括:
[0016]在满足预设条件的情况 下, 对所述判断区间进行 更新。
[0017]在一个或多个实施例中, 所述预设条件包括自上一次更新所述判断区间起经过预说 明 书 1/10 页
3
CN 115409425 A
3
专利 风险数据的识别方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:26上传分享