安全挑战

随着大数据的进一步发展,重视数据隐私和安全已经成为全世界的共识,各国都在加强对数据安全和隐私的保护,我国也在积极的开展个人信息保护工作。2016年11月7日,全国人大常委会通过的《中华人民共和国网络安全法》中明确了对个人信息收集、使用及保护的要求,并规定了个人对其个人信息进行更正或删除的权利。2019年,中央网信办发布了《数据安全管理办法(征求意见稿)》,向社会公开征求意见,明确了个人信息和重要数据的收集、处理、使用和安全监督管理的相关标准和规范。

这些法律法规在促进数据合规使用、保障个人隐私和数据安全等方面发挥了重要作用,但也在一定程度上增加了数据流通的成本,降低了数据综合利用的效率。

一方面,由于缺乏数据用于分析,各个行业对数据共享开放的需求十分迫切,迫切希望得到海量、高质量的数据资源来进行分析和挖掘;另一方面,拥有大量数据的数据平台,由于国家数据安全法律法规的限制,不敢、不愿、不能完全开放数据……这使得数据隐私与数据价值挖掘存在着巨大的矛盾,亟需一种兼顾隐私保护、数据安全和数据流动利用的新技术来平衡该矛盾。如何兼顾数据开放共享和数据隐私保护,既保障安全合规,又不阻碍大数据价值的挖掘利用,成为数据治理过程中必须面对的课题。

解决方案

秉承“数据不动程序动”“数据可用不可见”的安全理念,奇安信创新性地推出数据安全开放平台,形成数据安全开放解决方案,既不需要事先对数据进行脱敏损害挖掘价值,也不需要把原始数据发送给数据使用方造成失控,确保数据所有权和使用权分离的方式,帮助数据拥有方合法、合规、安全地对外开放数据,将商业模式从原始数据交易升级为数据增值服务。

方案整体架构如下图所示:


• 数据拥有方

汇集大量多行业重要数据的大数据平台,希望在数据隐私不泄露的前提下,充分发挥数据最大价值。

• 数据需求方

缺乏数据的科研院校、AI公司等,希望能够获取大量数据,对多种数据源进行融合分析,得到最优分析结果。

数据安全开放解决方案主要由数据安全开放平台组成,通过将调试环境与运行环境分离,实现数据可用不可见,更大限度挖掘数据价值。方案支持多种数据源,支持对数据访问权限的严格控制,支持对所有数据操作的留痕审计,支持行为风险分析和识别,具备数据访问申请与授权体系和输出结果申报与审核机制,实现数据所有权和使用权分离,从而确保数据安全可控。

方案分为运行环境和调试环境两部分:

• 运行环境

数据拥有方在运行环境存储全量数据,通过对全量数据进行数据置换得到样本数据,样本数据不包含敏感信息,可供调试环境的数据分析师分析和使用,预览样本数据无误后可送到调试环境中。

• 调试环境

调试环境供数据需求方使用,分为管理员系统和数据分析师系统。

管理员通过配置访问控制策略,为不同的数据分析师授予不同的数据权限,真正实现细粒度数据授权,同时通过审计功能对用户的所有操作进行留痕,实现所有数据操作可追溯。

数据分析师可在数据安全开放平台上查看并使用被授权的样本数据,添加样本数据到实验中,通过机器学习工作台进行数据分析,将调试好的工作流运行到全量数据,实现隐私保护下的数据价值挖掘。

调试环境与运行环境分离的数据分析模式,既保证数据安全,又能充分发挥数据的最大价值。

方案特点

1.大数据分析平台

方案提供一站式的大数据分析平台,从数据收集、处理、分析,到机器学习、深度学习,所有流程都可以通过平台完成。

2.数据不动程序动,数据可用不可见

方案采用数据沙箱新技术,将调试环境和运行环境分离,实现“数据不动程序动,数据可用不可见”,数据分析方只能带走不含敏感数据的分析模型文件和分析结果,既确保原始数据不泄露,又充分发挥了数据的最大价值。

3.多源数据融合分析

数据安全开放平台能够分布式部署在不同的数据中心,在数据不流出各自数据中心的前提下,实现融合分析。

4.多环境部署

数据安全开放平台支持云平台、虚拟化平台及物理机等异构基础设施上进行部署,满足客户不同环境下的部署需求。

5.高扩展、高可用

数据安全开放平台基础设施组件采用高拓展性的虚拟化架构,深度融合虚拟化扩展能力,一站运维,统一部署,为数据交换保留了适应业务发展的横向扩展能力。

应用价值

方案具备数据沙箱、隐私保护前提下的数据挖掘、数据访问安全管控等能力,在保障数据所有权的前提下,将赤裸裸的数据交易升级为数据服务,为拥有海量数据的大数据平台实现更大化的数据挖掘价值,可广泛用于政府、金融、医疗、教育等有数据共享开放需求的大型企业单位。

• 政务大数据支撑产业发展

近年来,政府践行国家大数据战略,建设大数据平台,基于数据安全开放平台技术,方案可向社会企业安全开放数据,既能保证数据隐私安全,又能充分发挥政务数据价值,实现以安全促兴业,形成基于数据的创新服务产业。


• 医疗数据安全共享开放

各地卫健委响应国家健康医疗大数据战略,纷纷建设医疗大数据平台,基于数据安全开放平台技术,方案可实现健康医疗大数据的安全共享,在保证数据可用不可见、原始数据不流出的情况下,提供给医院或第三方企业,用于医疗数据的充分挖掘。