1 数字水印技术概述
1.1 数字水印定义
数字水印(Digital Watermark)是指从原始环境向目标环境进行敏感数据交换时,通过一定的方法向数据中植入水印标记,从而使数据具有可识别分发者、分发对象、分发时间、分发目的等因素,同时保留目标环境业务所需的数据特性或内容的数据处理过程。数据水印具有隐蔽性、可追溯性、确定性等特点[1]。1.2 数字水印的分类
(1)根据数字水印的展现形式,可以将其分为明水印和暗水印(见表1)。
表1 数字水印在展现形式上的分类
分类定义作用
明水印指肉眼看得到的水印,就是将水印内
容的元素覆盖在目标元素上面
c盘可以格式化吗提醒用户及防止截图泄露
暗水印指肉眼看不到的水印,通过在一些载
体数据中添加隐藏标记实现
主要用于泄露溯源和版权保护
(2)根据数字水印所关联的载体或数据类型,可以分为文件水印、图片水印、视频水印、数据库水印、网页水印、应用系统接口(API)水印等。
1.3 水印添加与水印提取流程
(1)水印添加阶段:将原始数据和通过密钥加密的水印内容输入到水印添加算法,获取到含水印的数据。相对于原始数据,含水印的数据只会有细微的变化,不易被察觉。
(2)水印提取阶段:将含水印的数据,通过水印提取算法来判断是否含有水印,提取水印的具体内容,进而定位数据的具体来源(见图1)。
数据库水印技术在政务数据交换场景中的应用
刘小芳
(泰州市大数据管理中心,江苏 泰州 225300)
摘要:通过对政务数据安全建设过程中数字水印技术,特别是数据库水印技术在数据交换场景中的应用进行分析与研究,以期能为政府部门提升政务数据安全防护能力、制定更加有效的数据安全策略提供参考。
关键词:数据安全;数字水印;水印溯源;数据库水印
doi:10.3969/J.ISSN.1672-7274.2023.01.034
中图分类号:TP 309.7 文献标示码:A 文章编码:1672-7274(2023)01-0105-04
Application of Database Watermarking Technology in Government Data
Exchange Scenarios
LIU Xiaofang
(Taizhou Big Data Management Center, Taizhou 225300, China)
Abstract: Through the analysis and research of digital watermarking technology in the process of gov
ernment data security construction, especially the application of database watermarking technology in the data exchange scene, it is expected to provide a reference for the government departments to improve the government data security protection ability and formulate more effective data security strategies.
Key words: data security; digital watermark; watermark traceability; database watermark
作者简介:刘小芳(1989-),女,江苏泰州人,
主要从事政府行业政务数据共享开放以及政务信息化系统建设工作。
图1 水印添加与水印提取流程
1.4 数字水印评价指标
一般可以从以下6个维度来评价数字水印[2]。
(1)鲁棒性:数据库遭到有意或无意处理后水印的提取情况,如增加、删除或篡改操作,评价指标为误码率(BER)。
(2)保真性:含水印数据库与原始数据库的数据差别,评价指标为平均绝对误差(MAE)。
(3)水印容量:可嵌入的最大有效载荷,评价指标为嵌入率(ER)。
(4)计算代价:水印算法的计算代价,评价指标为算法的时间复杂度(O)。
(5)安全性:根据Kerckhoff法则,水印算法是公开的,其安全性依赖于水印密钥,攻击者在知晓嵌入和提取算法的情况下也无法检测或去除水印。
(6)可用性:嵌入水印后数据库不影响数据挖掘和统计分析等应用。
1.5 数字水印技术在政务数据交换场景中的应
用设计
在政务数据安全建设过程中,数据泄露的风险点存在于数据采集、传输、存储、处理、交换和销毁等数据全生命周期的各个环节中。数字水印技术的典型应用场景涉及数据交换环节。政务环境中的数据交换,既包括各个业务系统之间的数据交换,也包括部门内部或组织内部的数据交换,还包括跨部门甚至跨委办局的数据交换。
利用数字水印技术对政务数据进行保护,需要结合所保护数据所存在的载体,采用明水印与暗水印相配合的方式。一方面通过明水印,明示给数据操作人员数据水印的存在,起到警示与威慑的作用;另一方面通过暗水印,利用暗水印的鲁棒性,抵御多种攻击行为,保障泄露溯源的有效性和可用性。
2 数据库水印方案设计
通常,在一次性导出批量数据甚至是整表、整库数据时会利用数据库水印技术。考虑到数据交换场景的复杂性,水印方案应能够支持库到库、库到文件、文件到文件、文件到库的水印分发方式,以便增强数据泄露后的溯源能力。数字水印技术可以帮助规范数据交互,使得数据共享过程安全可控,数据资产版权明晰,可在每份共享的数据资产上加入水印标识。水印信息包含但不限于以下内容:处理人员、处理系统IP地址、处理时间、处理方式等[3]。2.1 数据库水印的技术原理
数据水印技术可以支持使用伪行、伪列、无痕等多种水印算法,在数据内容里标记水印信息(见图2)
。
例如,通过伪行的嵌入,对每个生成的仿真元组做哈希运算,公式如下:
hash=Hash(K,x,P i) mod (N+N’)
式中,K为密钥;x为待插入的伪元组;P i为该伪元组的主键值;N为原始数据库的元组数;N’为伪元
组数。将伪元组随机插入到hash值所在的行。
对于嵌入的伪元组值,用户要存储在安全的地方,方便水印提取时做比对。水印信息注入后,一旦发生数据泄漏事件,通过导入泄漏的数据样本或者文件到水印系统,即可以解析出水印信息,帮助用户确定泄漏源,从而达到溯源定责目的。
2.2 数据库水印的应用场景
2.2.1 数据确权
政务数据在共享/交换过程中数据往往会流转到多个业务系统和多个数据使用者,一旦数据被盗用或者出现侵权问题,若是无法提供有效证明证实对数据的所有权,不但会失去数据拥有者的相关权益,还有可能承担不必要的责任。若是对数据添加水印标记后再进行共享/公开/交易,数据拥有者在版权纠纷中将会很容易证实对数据的所有权,从而保障自己的合法权益。
2.2.2 溯源定责
政务数据使用过程中,存在数据共享分发与数据回流等数据流转场景,流经途径通常是比较难掌控的,一旦发生数据泄漏或被恶意盗取,若缺少溯源能力,数据拥有者无法知晓泄漏时间、泄漏主体等信息。一是无法有效梳理安全管理与技术措施的薄弱环节,安全合规建设难以落地;二是实施犯罪行
为的泄漏者若未被定责,数据泄漏事件可能会更加频繁,严重损害数据拥有者的权利。若在分发数据前先对数据进行水印标记,快速溯源定责将会轻而易举。
图2 伪行水印、伪例水印与无痕水印
2.3 数据库水印的应用设计2.
3.1 数据库水印添加流程
(1)添加数据源和目标源。数据源是指原始数据存储的位置,目标源是指通过系统添加水印信息后的数据存放的位置。数据源可以是结构化数据库,也可以是具备一定格式的CSV 或者Excel 文件。
(2)对原始数据源进行水印数据发现即敏感数据发现识别。通过扫描识别出需要通过添加水印进行保护的敏感数据字段。
琉璃美人煞小说结局(3)添加水印信息。水印信息可以根据溯源的具体需求,添加数据的所有者信息、数据流转目的、数据分发对象等信息。
(4)生成水印方案。所谓水印方案是指可以应用于多个水印任务中的一个水印模板,可以供其他的水印添加流程进行调用。
(5)执行水印任务。在完成水印配置后,正式执行水印添加的过程。水印任务执行成功后,水印信息会被注入到目标数据库或目标文件中。
2.3.2 数据库水印溯源流程
数据库水印的溯源流程如下(见图3)。(1)获取被泄漏的数据。
(2)根据泄露数据文件类型,处理如下:如果是
Excel 、txt 、csv 等文件,直接保存到某个目录;如果是SQL 数据库脚本等文件,将数据导入到溯源测试数据库。(3)执行水印溯源,识别出数据的水印信息。如果是Excel 、txt 、csv 等文件,可上传文件进行溯源;如果是SQL 数据库脚本等文件,可以对数据导入后的数据库表直接进行溯源。
广东旅游(2)在表中添加一行,随机从表内其他行抽取不同字段数据组成一条新记录。
(3)判断新记录中是否存在敏感数据,如果存在,则进行仿真脱敏。(4)根据事先定义好的水印方案,添加水印信息并最终生成伪行。2.3.3.2 伪列水印
(1)在表中插入一个新的字段作为伪列,伪列字段名称可以从表中已有字段名添加前缀、后缀标识后生成新的字段名。
(2)对伪列字段进行内容填充,根据事先定义好的水印方案,添加相应的伪列随机编码作为水印信息并生成伪列。2.3.3.3 无痕水印
(1)扫描和识别数据源中符合添加无痕水印的字段。
(2)对符合条件的列进行字段长度扩充,避免由于长度限制导致水印嵌入失败。
(3)在记录末尾添加无痕水印信息。
2.3.4 数据库水印应用注意事项
2.3.4.1 水印密度问题
在伪行水印与无痕水印方案中,存在水印密度问题,即原始数据量与添加水印信息的数据量的比例关系。水印密度过高,一方面容易被攻击者察觉,另一方面也会面临数据库存储空间膨胀的问题;但是水印密度过低,又可能造成水印溯源成功率下降的问题。因此,水印方案中数据密度指标的制定,需要结合数据源的数据特征做细致分析和调整,通常情况下,水印密度范围为5%~15%。
2.3.4.2 水印溯源过程的安全问题
在数据库水印添加及数据溯源的过程中,应确保原始数据与添加水印的数据都不会落盘到数据库水印系统上。这样设计一方面使得水印分发流程更加清晰,另一方面减少了中间环节数据泄漏风险,增强了水印分发过程的安全性。济南名吃
2.3.4.3 确保数据库水印的隐秘性与数据库的可用性
数据水印标记信息应不易被发现和察觉。伪行水印与伪列水印算法的应用,需要根据数据特征进行灵活选择,如对于字段较少的数据表,就不适合使用伪列水印。另外,应在保证添加水印后数据的可用性的同时,最大限度地减少对数据使用的影响。
图3
数据库水印溯源流程
2.3.3 数据库水印算法
2.3.3.1 伪行水印算法分析普兰店市教育局网
(1)对数据源中的字段做属性分析,根据其敏感
类型进行规则适配。
(下转第110页)
息结果与模块初始标准特征目标值,判断两者之间的数据差值,使建筑工程中数字化管理产生的实际效果更加明确。
4.6 按照检查结果及时指出建筑工程中存在的问题
以检查结果为依据,从中出建筑施工中存在的问题,针对这些问题采取有效的质量控制措施,并研究产生问题的原因,根据原因变更影响因素或模块特征目标。在建筑施工过程中,数字化管理手段的应用有利于实现科学化、规范化的工程管理,助力于高效率管理。
4.7 数字化管理与信息化管理相结合
将数字化管理手段应用于建筑工程施工领域,构建科学的管理机制,以数字化模块为基础,采取模块特征目标数值化操作,对整个建筑工程实施模块化数字化管理。以此为基础,将计算机与网络技术同时引入,有效收集、传输、处理与统计数字信息,逐渐实现建筑工程信息化管理。在数字化管理过程中,可以通过电子数据库对模块分解与编码、特征数据与标准数字等数据信息的处理与存储,依据计算机管理软件能高效操作信息采集、处理、传输与共享等多个环节,经过数据统计处理后便能促使图标信息形成,能够进行直观对照,比人工处理要便捷很多。建筑工程施工实施数字化管理时,还要充分考虑工程信息化管理需求,促进数字化管理体系的构建,保证工程数字化管理为搭建信息化平台创造有利条件,提高建筑工程整体效益以及管理水平。
4.8 组织数字化管理人员参加教育培训
对于整个工程项目来说,管理人员是基础和保障,主要工作是负责整理收集数据信息,而每个环节又有信息技术的支撑。以建筑行业的实际需要为前提,定期为管理人员开展技术培训,使他们熟练的掌握现代数字化科技。为打造一支专业的数字化管理团队,可以招聘掌握数字化技术的人员,为建筑工程的数字化管理服务,开展定期培训,对培训结果定期考核,只有这样才能达到学以致用的目的,考核过程中实现优胜劣汰。5 数字化管理手段应用于建筑工程施工 的发展趋势
5.1 全面数字化
在当前的施工管理工作中,从工程项目的立项到建设和管理,都要利用数字化管理系统进行管理,每个参与者都要做好监控管理工作。反之,将导致整个数字化管理体系出现不连通的问题,也难以实现工程项目的管理体系数字化结构。
5.2 立体协同化
建筑行业应用数字化管理就要利用虚拟的形态去演示交互性,以多维立体式工作模式加快多感应、多交互式可视化沟通的实现,由平面向立体可视化转变。以工程施工的周期任务要求为基础,整合工作流程,提高业务的安全性和连贯执行性,构建企业之间的协同工作。
5.3 互联网智能分析化
利用互联网对不同地域分散的资料信息再组合进行系统分析,真正实现信息的交互和共享,信息处理中利用现代科技手段能促进人工智能的开展,减轻管理人员的工作压力。
6 结束语
近年来,建筑工程市场的竞争越来越激烈,建筑工程施工中需要引入数字化管理理念,采取必要的数字化管理手段,提高建筑工程管理水平。为此,要加强数字化管理手段在建筑工程施工中的应用,加大对数字化管理重视力度,并对建筑施工进度实施结构化分解,不断优化建筑工程施工中的数字化管理手段,同时还要跟踪与检查建筑工程施工质量,按照检查结果及时指出建筑工程中存在的问题,组织数字化管理人员参加教育培训,只有这样才能保证建筑工程施工质量,进一步提高施工水平。■
参考文献
[1] 关秀丽.建筑工程施工中数字化管理手段的应用探微[J].建材与装饰,
没收个人全部财产2018(33):157-158.
[2] 杨荣光.建筑工程项目质量管理分析[D].成都:西南交通大学,2013.
3 结束语
数字水印技术是政务数据安全保护体系中的一个重要技术手段,数据库水印技术在政务数据交换场景中,为政务数据的安全流转提供了一种有效的保障措施。■参考文献
[1] JR/T 0223-2021,金融数据安全数据生命周期安全规范[S].
[2] Shehab, M., Bertino, E., Ghafoor, A.: Watermarking Relational Databases
Using Optimization-Based Techniques. IEEE Trancatiions on Knowledge and Data Engineering,2008,20(1):116-129.
[3] GB/T 39477-2020,信息安全技术政务信息共享数据安全技术要求[S].
(上接第107页)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论