区块链数字债券 新型债券市场金融基础设施:隐私数据安全计算_乐鱼官方网站_乐鱼官方是赞助了大巴黎|官方网站入口 
乐鱼官方网站
乐鱼官方网站

区块链数字债券 新型债券市场金融基础设施:隐私数据安全计算

时间: 2024-01-22 05:58:25 |   作者: 乐鱼官方入口

  近年来,数据安全有关规定法律法规密集出台,债券市场金融基础设施需要提升数据安全服务能力以增强我国债券市场的互联互通,提升金融信息整合度、市场透明度和资金流通性,改善监管穿透能力。本文研究新型债券市场金融基础设施,聚焦隐私数据安全计算,打造数字经济竞争优势,驱动金融业生产方式、服务方式、治理方式变革,营造应用合规、数据安全的良好数字生态。

  2018年以来,我国数据安全产业 2 增长势头迅猛,同比增速逐年快速上升且连续两年超过30%(见图1)。2020年10月,“十四五”规划和2035年远景目标纲要提出激活数据要素潜能,加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治理方式变革,强调数据价值释放、数字化转型、数据治理的重要性,对我国数据安全产业提出了更高的要求。

  同时,西方主要发达经济体相继发布数据战略,利用数据基础设施建设、人才培养等手段促进该产业发展。2020年,欧盟发布《欧洲数据战略》,提出更新法规政策以提供更多数据安全产品,进一步投资数据安全技术创新等愿景,明确关注社会数据安全治理,提升数据中心、边缘安全、数据托管等方面的能力,扩大欧盟数据安全人才规模,进一步提高欧盟全域数据安全能力。同年,美国发布《联邦数据战略和2020年行动计划》,提出促进数据流通、保护数据完整性、提高数据处理透明度、增强数据管理分析能力和促进数据访问途径多样化等40项具体数据管理实践,提升了社会对于数据安全的重视程度,进一步促进了政府及企业对数据安全产品和服务的需求。

  债券市场流转的金融数据直接关系到用户的资产、信用、消费习惯等重要隐私,债券数据的融合应用必须严格保障数据隐私安全,确保符合法律和法规。因此,本文研究新型债券市场金融基础设施,聚焦隐私数据安全计算,从债券市场金融基础设施定义、构建新型债券市场金融基础设施的意义、隐私数据安全计算关键技术、新型债券市场金融基础设施技术方案等方面展开讨论。

  金融基础设施的概念在国内外有所区别。国际支付结算体系委员会和国际证监会组织技术委员会在2012 年联合发布《金融市场基础设施原则》,将金融市场基础设施定义为中央证券存管机构、中央交易对手方、证券结算系统、支付系统和交易数据库。2020年,人民银行等六部门联合印发《统筹监管金融基础设施工作方案》,认定我国金融基础设施主要包括金融资产登记托管系统、清算结算系统(包括开展集中清算业务的中央对手方)、交易设施、交易报告库、重要支付系统、基础征信系统六类设施及其运营机构。

  债券市场是我国资本市场的重要组成部分,能够有效传导货币政策、提高直接融资比例、防范系统性金融风险、优化资源配置、提供市场基准利率和提供低风险投融资工具等。服务于债券市场的金融基础设施即为本文重点讨论的对象。

  金融业是数据密集型行业,而债券市场作为金融市场的重要组成部分,对数据安全和保障用户隐私的需求较高。同时,我国银行间债券市场和交易所债券市场长期面临着信息整合度较低、资金流通性较弱、互通互信程度不足等问题。2022年,部分交易所、登记结算机构等债券市场金融基础设施联合发布《银行间债券市场与交易所债券市场互联互通业务暂行办法》,推进债券市场业务互联互通,建设高效的市场服务体系,要求债券市场金融基础设施为跨市场、跨机构客户提供服务。

  构建新型债券市场金融基础设施,实现隐私数据安全计算,对于增强我国债券市场的互联互通性、提升金融信息整合度、增强资金流通性、提升市场透明度、改善监管穿透能力等方面有重要意义。

  用于建设隐私数据安全的新型债券市场金融基础设施的4项关键技术分别为联邦学习、多方安全计算、机密计算和差分隐私。2021年IT研究与咨询公司Gartner发布的数据安全技术成熟度曲线相关报告中,上述核心技术大多处于萌芽期,因此目前关键技术的突破及在债券市场的落地应用需要头部科研机构及金融机构勠力同心,优势互补。

  联邦学习是一项结合传统密码学及机器学习的分布式学习技术,旨在面向多家不愿或不能暴露自家明文数据的数据提供方,在满足数据隐私安全的前提下进行联合模型训练,达到保护隐私的同时完成数据价值释放的效果。联邦学习的参与方在达成协议后各自从服务中心方下载带训练模型,使用自有数据进行本地训练后将提取出的数据特征、模型参数等要素加密上传至服务中心方,实现“数据不出本地”。整套流程中各方的数据价值得到充分释放,而原始数据没有暴露给其他参与方,即在法律法规层面符合近年来出台的各类数据隐私保护条例,也符合债券市场的不同金融机构之间出于竞争考虑不愿暴露客户数据的要求,以技术层面的突破为债券市场金融基础设施提供新型数据服务奠定了基础。

  联邦学习可以根据其参与方数据集的共同特征划分为纵向特征联合、横向样本联合和联邦迁移三种类型。一是纵向特征联合,适用于为相近的客户提供不同业务的多个债券市场参与方,其数据特征为具有相近客户的不同数据特征,例如金融基础设施可以引入其他金融机构及工商、司法、税务、舆情、产权、投融资、经营、财务、地企关系等多方数据进行债券违约风险联合监测,实现基于多源异构大数据的债券违约预警、分析、处置全流程创新业务。二是横向样本联合,适用于为不同的客户提供相近业务的多个债券市场参与方,其数据特征为具有同样数据特征的不同客户,例如当前我国债券市场三后台可以通过横向联合实现同一债券业务的全量数据交互,助力我国债券市场金融基础设施构建跨市场、跨机构、跨地区的多方协作机制,完善债券市场金融基础设施监管体系和治理模式(见图2)。三是联邦迁移,适用于客户和业务均不相同的多个债券市场参与方,而其中一方拥有性能优良的机器学习模型,其他数据提供方利用多方数据特征的关联性将该模型通过迁移学习技术迁移至新领域,例如债券市场金融基础设施可以借鉴证券公司在股票风险预警等方面的成熟模型和经验,为债券市场参与方提供迁移学习服务。

  多方安全计算是一项重要的密码学技术,旨在为多个互相不信任的数据提供方提供可信加密方法,在各方不泄漏输入数据隐私的情况下完成结果计算和返回,实现“数据可用不可见”。多方安全计算可以在各参与方隐私数据无需归集与明文共享的情况下实现特定函数计算,进而达到保护数据所有方的隐私及数据资产安全的效果。目前,多方安全计算已经在商用领域逐步应用,为实现数字资产的安全管理、多方数据联合查询、隐私保护模型训练、业务黑名单安全共享等业务作出了贡献。

  多方安全计算中包含不经意传输(或称“混淆传输”)、零知识证明、同态承诺、同态加密、秘密分享、混淆电路等技术,目前常见的多方安全商用解决方案大多使用了秘密共享技术,其利用由加法门和乘法门组成的基本运算逻辑重构业务需要的复杂函数,能够有效缩减通信规模,进而将多参与方的信息交互过程转为在密文下进行,实现数据隐私安全前提下的联合使用。债券市场金融基础设施可以在营销、风控、反诈骗、反洗钱等业务中为参与机构提供多方安全计算服务,在不泄露任何参与机构的原始数据和计算过程的中间结果前提下保证计算结果具备准确性、隐私性(见图3)。

  机密计算是一项综合应用软硬件的隐私保护技术,旨在为需要隐私保护的应用程序和私密数据提供安全隔离的执行环境,在独立的存储空间和数据通路中运行,实现“程序可用不可变”。机密计算通过集中存储多参与方应用程序和隐私数据的方式对这些程序和数据进行受保护的操作,其他未授权的、恶意的代码都无法访问或修改受保护的程序及数据。目前,机密计算已经在金融联合风控、反欺诈、数据服务平台、联合营销、政务数据开放等众多领域中落地应用,由于该项技术为原有应用程序和隐私数据提供保护,理论上在任何需要保护代码和数据隐私安全的场景中都可以外置机密计算技术。

  机密计算在可信执行环境(Trusted Execution Environment,TEE)中加载运算,通过基于软硬件的数据隔离来保护内部加载的应用和私密数据不被常规操作系统干扰,具有程序机密性、应用完整性、私密数据机密性和完整性的优势。基于可信执行环境的机密计算通过软硬件方法控制访问权限,防止内部应用和私密数据受到未经授权的访问和修改,从而提高债券市场金融基础设施管理私密数据和应用程序的安全水平。基于TEE的机密计算方案的处理性能和安全性能依赖于TEE中可信执行控制单元的技术架构。

  机密计算技术具备以下几点优势:一是对可信执行环境中的模型、语言、算法逻辑、可计算类型不设限制,因此具备更强的业务适配性;二是可实现应用程序、算法流程、隐私数据、用户身份等整体一致性证明,具备较高的可信度和可解释性;三是对高复杂度算法、多层次程序逻辑支持程度较好,应用执行效率较高。我国在这方面存在的问题是依赖国外芯片厂商,信创硬件升级面临挑战等。

  差分隐私是一项可量化的、针对数据库隐私问题的隐私保护技术,旨在为需要保护的业务数据添加噪声以保护其敏感信息无法被推断,实现“统计数据不可拆”。差分隐私在保留业务数据统计性特征的前提下,通过对私密数据集进行各类变换,在私密数据集的统计结果中加入噪声或对用户数据进行修改,以抵御对隐私数据的背景知识攻击。该技术通过向查询数据中引入噪声使其在无干扰值附近产生概率性波动,达到对真实数据的差分隐私保护,所增加的噪声越强,隐私保护效果越明显,但数据可用性越低,因此在实际使用中需要兼顾数据可用性和隐私保护效果选择合适的噪声强度。目前差分隐私已经在个性化服务推荐、医疗数据发布、金融数据查询、工业物联网数据分析、位置大数据共享、网络社交隐私保护等领域落地应用,为查询特定数据库时的隐私保护发挥了作用。

  差分隐私通常采用拉普拉斯噪声机制、高斯机制和指数噪声机制,拉普拉斯噪声机制针对数值型数据,将符合拉普拉斯分布的独立噪声添加入查询映射函数的输出结果中,进而确保返回值无法被用于推断原始数据集合;高斯机制同样针对数值型数据,但采用符合高斯分布的独立噪声;指数噪声机制针对非数值型数据,通过设定打分函数以一定概率值返回具有不确定性的输出结果,进而实现差分隐私。债券市场金融基础设施可以在联合查询、客户特征统计等业务中为参与机构提供不暴露客户个人数据的统计计算结果,实现业务数据统计价值的安全释放。

  金融基础设施的一个典型业务场景是结合内外数据对债券市场从业机构输出的金融工程模型、风险评估服务。传统解决方案通常采用数据脱敏技术,将内外部数据敏感信息模糊、删除后把明文数据聚合并进一步建模或进行金融工程计算。随着数据隐私保护相关法律法规的集中出台和隐私计算等技术手段的迭代发展,传统应用脱敏技术的解决方案中原始数据及业务模型泄露风险、不符合数据隐私保护条例、数据融合成本过高等业务痛点逐渐暴露,债券市场金融基础设施亟待应用新技术、新方法以提供数据及模型双向隐私保护的债券市场服务。

  因此,本文提出一种应用隐私计算技术以保护数据及模型双向隐私的新型债券市场金融基础设施技术方案,如图4所示。不同于需将明文数据集中到第三方的传统方案,本方案在债券市场金融基础设施建设连接多个数据源和需求方的隐私计算平台,采用机密计算技术确保应用程序及本地数据安全,采用区块链技术对服务过程中加密数据流转进行存证,采用多方安全计算技术实现金融工程提供方的模型隐私和客户的业务数据隐私双向保护,因此可以解决不同机构间由于隐私保护政策所带来的合规性挑战,并在实现数据安全共享和数据价值安全释放的同时具备合规性、可追溯性、安全性等优点。

  在传统债券业务解决方案中,多家从业机构用自身持有的数据构建业务模型或进行查询统计等操作,但由于债券市场不同业务条线较为割裂且分属于不同监管机构和前后台机构,每家从业机构自身数据规模和覆盖范围均较为受限,导致建模性能受限且查询统计覆盖面积较小。银行间债券市场、交易所债券市场的不同从业机构之间客户类型、行为特征、地理位置等分布差异较大,若从业机构能在符合隐私数据安全要求的前提下共享业务数据并基于共享的数据合集构建模型或开展联合查询统计操作,可显著地扩大模型性能和查询统计覆盖面。

  因此,本文提出一种应用多方安全计算技术的跨机构、跨市场提供协同服务的技术方案,针对传统方案中债券隐私数据明文共享安全性较低、合规性较差、机构参与意愿较弱的痛点,引入多方安全计算技术实现数据不出域的隐私安全服务,为新型债券市场金融基础设施实现多方协同、数据安全、合法合规的跨市场、跨机构联合计算、查询、统计服务,且查询等操作可以实现有限范围的记录以保护业务隐私。例如,新型债券市场金融基础设施可以提供跨市场、跨机构的联合担保查询计算服务,在不暴露各参与机构中客户隐私数据的前提下实现联合计算,确认客户是否满足担保条件。

  目前,我国债券市场金融基础设施与工商机关、司法机关、税务机关、公安机关等外部机构的数据融合共享程度较低,与其他从业机构之间数据共享意愿也较弱,债券市场间数据孤岛现象较为明显。债券市场各从业机构和市场客户有获取更先进服务的诉求,但由于债券市场金融基础设施获取工商数据、司法数据、税务数据、公安数据、舆情数据、产权数据、投融资数据、经营数据、财务数据、地企关系数据等外部数据时,存在数据安全要求不清晰、数据采集标准不统一、数据融合需要工作量大、底层数据资源框架不兼容等技术和法规问题,导致数据融合成本高昂且金融等高安全属性的数据无法合规共享。

  因此,本文提出一种应用联邦学习技术的数据融合建模方案,解决多源异构数据融合中数据安全要求、采集标准、框架兼容等问题(见图5)。债券市场金融基础设施建立数据融合建模服务平台,外部机构和数据供应商作为外部异构大数据来源接入平台,第三方技术提供方为平台提供新模型落地应用、平台升级优化、运维保障等服务,监管部门接入平台进行穿透式监管,在联邦学习框架下平台应用多源异构大数据训练业务模型并向债券市场客户提供创新业务服务。

  以债券违约风险监测为例,债券市场金融基础设施可以通过联邦学习框架融合外部数据源,进行特征对齐和模型训练,并提供基于多源异构大数据的债券违约风险监测模型,实现不同数据源、不同格式的数据在隐私安全的前提下共同提取特征并提供参数联合训练模型,具备安全性好、模型性能强、机构参与意愿高等优点。

  推进债券市场金融基础设施革新与发展,实现金融数据隐私安全交互,是立足国家“十四五”规划和2035年远景目标纲要提出的“数字中国”远景目标,助力打造创新型、友好型、开放型数字生态,驱动债券市场生产及治理模型革新的重要任务。

  一是在债券市场数字建设方面打造数字化的经济竞争优势,驱动金融业生产方式变革,助力金融业实现数据驱动的精细管理、精益生产、精准营销、精确规划,降低基础设施运行成本,提高市场服务效率,催生数据驱动的新应用、新模式、新业态。

  二是在债券市场数据服务方面加快数字债券建设步伐,驱动金融业服务方式变革,提高债券市场开放和数据共享程度,推动线上线下基础设施服务协同发展与深度融合,提高债券市场服务能力便捷性及数字债券应用的普惠性。

  三是在债券市场治理方面提高基础设施建设水平,驱动金融业治理方式变革,提高数字化监管效能,实现债券数据跨部门、跨市场、跨地区汇聚融合、深度利用和高质量协作。

  四是在债券市场生态方面激发安全技术创新活力,营造良好数字生态,提高债券数据应用透明度,实现债券数据合规应用中的数据最小化、数据分类分级和数据匿名化,促进债券数据应用的合规化发展。

  2.数据安全产业是为保障数据持续处于有效保护、合法利用、有序流动状态提供技术、产品和服务的新兴业态。

  [1] 贝劲松.金融基础设施数据融合应用实践[J].中国金融,2021(3).

  [2] 窦悦,易成岐,黄倩倩,莫心瑶,王建冬,于施洋.打造对全国统一数据要素市场体系的国家数据要素流通共性基础设施平台——构建国家“数联网”根服务体系的技术路径与若干思考[J].数据分析与知识发现,2022,6(1).

  [3] 康晓宇.数据基础设施支撑金融科学技术创新[J].中国金融,2020(22).

  [4] 王延昭,范皓,唐华云,李荣.数字债券长期演进体系构想[J].武汉金融,2022(2).

  [5] 王延昭,唐华云,黄烁,马凯迪.挖掘数据业务价值,探索债券市场基础设施数字化转型[J].武汉金融,2022(2).

  [6] 杨竑.金融科技助力行业数字化转型[J].中国金融,2021(11).

  [7] 姚前.基于区块链的债券市场基础设施建设[J].中国金融,2021(7).

  [8] 曾坚朋,赵正,杜自然,洪博然.数据流通场景下的统一隐私计算框架研究——基于深圳数据交易所的实践[J].数据分析与知识发现,2022,6(1).