拓宽保密检查范围,管控涉密数据风险——以某人民法院为例

一、项目背景

随着信息化的深入发展,大数据时代的来临,越来越多的人开始关注数据的重要性——核心数据资产。

特别是关于企事业单位业务推进、发展的核心数据以及承载国家核心秘密的涉密数据,不仅关乎企业事业单位的生存,更关系着国家发展与国际战略部署等国家大计。

对此,国家通过立法等相关措施进行顶层指导规范,如《中华人民共和国保守国家秘密法》、《中华人民共和国刑法》等,企事业单位必须针对核心数据、涉密数据采取有效完善的安全监管措施,及时建立安全管理制度,将其限制在特定区域,防止泄密。

二、需求分析

1. 数据库泄密隐患定位

高级人民法院作为政府重要组织单位,随着信息化进程的逐步推进,数据库及泛数据库载体(应用系统)内留存了大量的数据。

由于人员保密意识薄弱或其它主客观因素,不可避免会有些涉及本单位甚至涉及国家秘密的数据违规留存。

为了防止涉密数据泄露,需提前掌握是否存在核心数据特别是涉及国家秘密的数据违规留存的情况。

2. 泄密隐患排除

某高级人民法院形成了涉密内网、办公专网、互联网等功能齐全的复杂办公环境,拥有大量的设备需要进行涉密信息的检查。

传统的单机检查工具耗时长、误报率高、消耗较多人力,因此需要更高效、快速的统一管理的保密检查系统,对体系内设备进行涉密信息排查。

三、解决方案

1. 部署拓扑

2. 方案实现

数据库保密检查系统基于深度内容识别技术,主要实现对文件存储服务器、数据库、协同办公系统以及公文流转系统等主流应用系统存储的涉密数据检查,及时发现非涉密网敏感数据,防止涉密数据外泄。

高级法院统一监管,了解整个体系的涉密数据检查情况,各下级法院分级管理,实现单位内部非涉密网涉密数据自查。

3. 技术支撑

(1) 全面的数据类型识别

可识别数据内容的文件类型超过300多种,可识别文件类型多达1300种。

(2)深度内容识别技术

检查端采用多种内容特征检查技术,实现对违规存储涉密数据的检查与匹配,支持的匹配技术如下:

  • 关键字/关键字组检查与匹配技术

  • 文档名称、类型、大小等文档特征匹配技术

  • 基于模式的识别技术

基于正则表达式的检查与匹配技术,可以通过涉密数据内容各组成元素,如数字、字、词以及数字、字、词等之间的逻辑组合关系运算模型加以检查与匹配,匹配方式更为准确和灵活。

基于模式脚本的内容检查与匹配技术,可以将基本内容检查技术及正则表达式通过逻辑组合形成模式算法,来实现更为精确的、全面的内容检查与匹配,从而将检查与匹配的精确度大幅提升。

(3)高效精准的图片识别技术

系统采用光学字符检查技术(OCR技术)即:采用光谱映像的方式将图片文档中的文字转换成为黑白点阵的图像文件,通过内置的识别软件将图像中的文字转换成文本格式,从而提取图片中的文字内容,以实现涉密数据检查。

(4)人工审核自学习技术

系统内置不可逆的指纹算法,可将文件内容生成一串唯一代码(即文件指纹),文件指纹生成后,系统提取指纹并建立白名单库(白名单——系统误报的文件指纹特征)。在检查过程中,发现与白名单库中的指纹特征相同的文件将自动过滤,不但减少误报也提高了检查的效率。

(5)基于中文分词算法的词库提取技术

系统采用内置基于主题模型的分类算法,对现有敏感数据进行自动分类。在分类的过程中,使用中文分词技术,提取各类型敏感数据的特征,然后,通过人工审核后形成各行业或重大事件的敏感数据特征库。

四、方案价值

1. 保密检查工作变被动为主动

单位可提前主动发现门户网站、应用系统以及终端等违规存储的涉密数据并及时消除隐患,避免发生泄密事件。

2. 提高保密意识

通过先进的技术手段,加强保密检查的力度及效率,进而提高单位的保密意识。

3. 节能增效

系统内置标密文件的识别模型,实现对标密文件的准确识别,并以高涉密概率和大红底置顶显示;自动化的检查方式,替代以往的人工检查,极大地提高了工作效率。

杭州世平信息科技有限公司(简称“世平信息”),致力于智能化数据管理与应用的深入开拓和持续创新,为用户提供数据安全、数据治理、数据共享和数据利用解决方案,帮助用户切实把握大数据价值与信息安全。

近期热点

 

中秋团建 | 元缘源园原圆,YUAN来有你!

世平信息网络安全宣传周盛况回顾 | 成都·杭州·西安

网络安全周 | 网信办领导、沈昌祥院士莅临世平展位

世平携手阿里邀您参加2018数据安全与隐私保护大会

关键信息基础设施安全风险评估解决方案

世平发布通用版数据泄露防护(DLP)解决方案

猜你喜欢

转载自blog.csdn.net/shipinginfo/article/details/83015017