————————————
基金项目
基金项目基金项目
基金项目:
::
:国家自然科学基金资助项目(61262076);广西自然科学基金资助项目(2012GXNSFBA053172);桂林理工大学科研基金资助项目
(002401003348)
作者简介
作者简介作者简介
作者简介:
::
:姜传贤(1978-),男,博士,主研方向:网络与信息安全,图像处理;程小辉,教授、博士
收稿日期
收稿日期收稿日期
收稿日期:
::
:2011-12-19 修回日期
修回日期修回日期
修回日期:
::
:2012-02-09 E-mail:
::
:emlong1976@tom.com
可逆文本水印算法研究
可逆文本水印算法研究可逆文本水印算法研究
可逆文本水印算法研究
姜传贤
姜传贤姜传贤
姜传贤,
,,
,程小辉
程小辉程小辉
程小辉
(桂林理工大学信息科学与工程学院,广西 桂林 541004)
摘
摘摘
摘 要
要要
要:
::
:提出一种可逆文本水印算法。该算法对文本特征进行分析,以确定待嵌入文本句子集,根据文本句子的奇偶性,利用同义词替换
评价模型将水印不可感知地嵌入到原始文本中,通过调整算法参数,满足不同的鲁棒性和不可见性需求。仿真实验结果表明,该算法具有
较好的不可见性,并能在提取水印后无损地恢复原始文本载体数据。
关键词
关键词关键词
关键词:
::
:文本水印;可逆水印;水印嵌入;水印提取;同义词替换;不可见性
Research on Reversible Text Watermarking Algorithm
JIANG Chuan-xian, CHENG Xiao-hui
(School of Information Science and Engineering, Guilin University of Technology, Guilin 541004, China)
【
【【
【Abstract】
】】
】This paper presents a reversible text watermarking algorithm. By analyzing the feature of the text, text sentence sets are acquired to
embed watermark information. According to parity of sentences and the evaluation model of synonymy substitution, the watermark is imperceptibly
embedded into the original text. Different robustness and imperceptibility requirements can be met by adjusting the parameters of the algorithm.
Experimental results show that the method can improve the invisibility of watermarking and recover the cover data without any distortion after
extracting the watermarking.
【
【【
【Key words】
】】
】text watermarking; reversible watermarking; watermark embedding; watermark extraction; synonymy substitution; invisibility
DOI: 10.3969/j.issn.1000-3428.2012.19.033
计 算 机 工 程
Computer Engineering
第 38 卷 第 19 期
Vol.38 No.19
2012 年 10 月
October 2012
·
··
·安全技术
安全技术安全技术
安全技术·
··
·
文章编号
文章编号文章编号
文章编号:
::
:1000—
——
—3428(2012)19—
——
—0126—
——
—03
文献标识码
文献标识码文献标识码
文献标识码:
::
:A
中图分类号
中图分类号中图分类号
中图分类号:
::
:TP301.6
1
概述
概述概述
概述
在一些特定的应用领域
(
如医疗、军事和司法领域
)
中,
由水印化过程导致的不可感知失真是不能容忍的,因此,
可逆水印技术引起了越来越多的关注
[1]
。可逆水印技术主
要集中在图像媒体等领域,而用于文本的可逆水印技术还
鲜有研究
[2]
。文献
[3-7]
提出了几类用于解决文本版权保护
问题的水印技术方案,这些方案都是建立在文本文档有足
够的冗余空间并且可以容忍一定程度误差的基础上。所
以,嵌入的水印信息将修改原始文本数据,但是对于上面
提到的特殊领域,文本数据应用不允许有任何的变化,而
该数据同样需要版权保护。为此,本文提出一种可逆文本
水印算法,该算法可以通过调整参数来满足不同的鲁棒性
和不可见性需求,并且具有较好的不可见性。
2
相关知识
相关知识相关知识
相关知识
把一个中文文本看成是由句子和标点符号构成的集
合,假设句子是不可分割的最小单元。
定义
定义定义
定义
同义词特征
[2]
根据同义词库
SD
和依存句法分析,检测句子
,若
能够检测出同义词集
i
=
≤ ≤
和主谓词集
(
其中,
表示同义词个数
)
,则同义词
在句
子
中的 位置 为
,同 义词库 中词 的编 码值为
(
其中,
. 1, .
)
;否则忽略。
同义词替换算法
[2]
步骤如下:
(1)
对载体文本句子中的
同义词
所在的句子进行依存句法分析,抽取搭配词集
。
(2)
根据文献
[2]
计算训练语料中得到的参数,分别计
算
所 在 同 义 词 组 中 其 他 词
的 所 有 值
, 找 出
最大的词
来替换
;若没有最大的,则用歧义词
组中的第
1
个来替换
,得出
i
= ⊕
,
其中,
表示异或。
3
可逆水印嵌入
可逆水印嵌入可逆水印嵌入
可逆水印嵌入与
与与
与提取算法
提取算法提取算法
提取算法
设
是求集合元素的个数,
!
为非编号值,
为
提取水印的密钥,给定初值
[] !
,
m
为水印的长
度,
为某个同义词,
是求余运算,
为给同义词编
号的密钥值,
=
,其中,
是单向
函数。
3.1
可逆水印嵌入
可逆水印嵌入可逆水印嵌入
可逆水印嵌入
可逆水印嵌入算法的思想如下:先对载体文本进行分
词和词性标注,根据句子的同义词特征,过滤出含同义词