专利风险数据的识别方法及装置 -在线下载 -pdf文件-ip.atghost.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211225871.4 (22)申请日 2022.10.09 (71)申请人中国工商银行股份有限公司地址 100140 北京市西城区复兴门内大街 55号 (72)发明人尹少聪　胡幸　黄萱　谭洋　 (74)专利代理机构北京三友知识产权代理有限公司 11127 专利代理师田勇　任默闻 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 40/04(2012.01) G06Q 40/02(2012.01) (54)发明名称风险数据的识别方法及装置 (57)摘要本申请提供了一种风险数据的识别方法及装置，可用于数据处理技术领域，该方法包括：对非风险数据进行主成分分析，根据所述非风险数据中的原始成分数据生成主成分数据，其中，所述主成分数据的维度大于1并且小于所述原始成分数据的维度，各维度的主成分数据相互独立；通过多变量控制图对所述主成分数据进行处理，生成判断区间；以及根据所述判断区间，对待检测数据进行风险识别。通过本申请实施例，能够提高风险数据的识别的准确性。本申请可用于金融领域或其他领域。权利要求书1页说明书10页附图3页 CN 115409425 A 2022.11.29 CN 115409425 A 1.一种风险数据的识别方法，其特征在于，所述方法包括：对非风险数据进行主成分分析，根据所述非风险数据中的原始成分数据生成主成分数据，其中，所述主成分数据的维度大于1并且小于所述原始成分数据的维度，各维度的主成分数据相互独立；通过多变量控制图对所述主成分数据进行处理，生成判断区间；以及根据所述判断区间，对待检测数据进行风险识别。 2.根据权利要求1所述的方法，其特征在于，所述主成分数据为从所述原始成分数据中选出的第一成分数据分别以各自的加权系数加权后生成的线性组合；并且/或者，所述主成分数据按照预设规则排序后，被输入到所述多变量控制图。 3.根据权利要求2所述的方法，其特征在于，所述主成分数据按照预设规则排序包括：计算所述主成分数据的得分，所述得分与所述第一成分数据的贡献率以及所述加权系数相关；以及按照得分由小到大的顺序，对所述主成分数据进行排序。 4.根据权利要求1所述的方法，其特征在于，所述方法还包括：在满足预设条件的情况下，对所述判断区间进行更新。 5.根据权利要求 4所述的方法，其特征在于，所述预设条件包括自上一次更新所述判断区间起经过预设时间，和/或，自上一次更新所述判断区间起检测了预设数量的待检测数据。 6.根据权利要求1所述的方法，其特征在于，根据所述判断区间，对待检测数据进行风险识别包括：对所述待检测数据进行主成分分析，生成所述待检测数据的主成分数据，通过多变量控制图对所述待检测数据的主成分数据进行处理，生成统计值；以及根据所述统计值和所述判断区间，对所述待检测数据进行风险识别。 7.一种风险数据的识别装置，其特征在于，所述装置包括：分析单元，其对非风险数据进行主成分分析，根据所述非风险数据中的原始成分数据生成主成分数据，其中，所述主成分数据的维度大于1并且小于所述原始成分数据的维度，各维度的主成分数据相互独立；生成单元，其通过多变量控制图对所述主成分数据进行处理，生成判断区间；以及确定单元，其根据所述判断区间，对待检测数据进行风险识别。 8.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的方法。 9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至 6任一项所述的方法。 10.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现权利要求1至 6任一项所述的方法。权　利　要　求　书 1/1 页 2 CN 115409425 A 2风险数据的识别方法及装置技术领域 [0001]本申请涉及数据处理技术领域，尤其涉及一种风险数据的识别方法及装置。背景技术 [0002]操作风险历来是银行业面临的主要风险之一，受到了银行业界的高度关注。近年来，随着银行机构越来越庞大，产品愈加多样化和复杂化，加上金融业和金融市场的全球化趋势，由操作风险而引起的金融案件给银行带来了巨大的损失。 [0003]操作风险控制能力是决定业务健康发展的一个重要因素。目前，针对形式多变的操作风险，银行基本都着手建立了各自的风险监控系统。其中，一种方式是通过预警规则加强欺诈侦别能力，来防范操作风险。但是，这种方式的预警规则依赖于专家经验，因此，在某种程度上会受到专家主观性的影响，存在滞后性、迭代缓慢和阈值容易侦探等特点。另一种方式是利用单变量的Shewhart图确定预警规则。但是，这种方式不能考虑风险因素的多元化，无法准确地进行风险数据的识别。 [0004]本部分旨在为权利要求书中陈述的本申请实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。发明内容 [0005]为了解决上述问题中的至少一个，本申请实施例提供一种风险数据的识别方法及装置，用以提高风险数据的识别的准确性。 [0006]根据本申请的实施例，提供一种风险数据的识别方法，其中，该方法包括： [0007]对非风险数据进行主成分分析，根据所述非风险数据中的原始成分数据生成主成分数据，其中，所述主成分数据的维度大于1并且小于所述原始成分数据的维度，各维度的主成分数据相互独立； [0008]通过多变量控制图对所述主成分数据进行处理，生成判断区间；以及 [0009]根据所述判断区间，对待检测数据进行风险识别。 [0010]在一个或多个实施例中，所述主成分数据为从所述原始成分数据中选出的第一成分数据分别以各自的加权系数加权后生成的线性组合。 [0011]在一个或多个实施例中，所述主成分数据按照预设规则排序后，被输入到所述多变量控制图。 [0012]在一个或多个实施例中，主成分数据按照预设规则排序包括： [0013]计算所述主成分数据的得分，所述得分与所述第一成分数据的贡献率以及所述加权系数有关；以及 [0014]按照得分由小到大的顺序，对所述主成分数据进行排序。 [0015]在一个或多个实施例中，所述方法还包括： [0016]在满足预设条件的情况下，对所述判断区间进行更新。 [0017]在一个或多个实施例中，所述预设条件包括自上一次更新所述判断区间起经过预说　明　书 1/10 页 3 CN 115409425 A 3

专利 风险数据的识别方法及装置

专利风险数据的识别方法及装置