没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学沙特国王大学学报www.ksu.edu.sawww.sciencedirect.comJournal of King Saud University基于开放词空间里姆A.Alotaibia,c,*, Lamiaa A.Elrefaeia,b,1a沙特阿拉伯吉达阿卜杜勒阿齐兹国王大学计算机信息技术学院计算机科学系b埃及开罗Benha大学Shoubra工程学院电气工程系c沙特阿拉伯塔伊夫塔伊夫大学计算机信息技术学院计算机科学系接收日期2016年9月3日;修订日期2016年12月10日;接受日期2016年12月28日2017年1月11日在线提供摘要数字水印用于保护文本版权和检测未经授权的使用。提出了两种针对阿拉伯文本的不可见盲水印算法。由于伪空格是用于强制隔离连接字符的非常小的空间,因此将其添加到字空格中以隐藏二进制位“0”或“1”。在第一个提出的方法中,伪空间是在阿拉伯文文本中基于点特征在正常单词间距之前和之后插入。第二种方法插入伪空间和其他三个小的或零宽度的空间以增加容量,其中它们的存在指示位“1”,而不存在指示位“0”。通过测试所提出的方法与现有的一些水印方法,使用不同长度的水印长度的可变大小的文本样本的比较结果。实验结果表明,该方法具有最高的容量和更高的不可见性比其他数字水印技术从文献。在大多数可能的文本攻击下测试了所提出的方法的鲁棒性。它们能够抵御电子文本攻击,例如:而粘贴、文本格式化和文本篡改的篡改率高达84%。©2017作者。制作和主办由爱思唯尔B.V.代表沙特国王大学。这是CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍*通讯作者。电子邮件地址:reem.a. gmail.com(R.A. Alotaibi),laelrefaei@kau.edu.sa,lamia. feng.bu.edu.eg(洛杉矶)。Elrefaei)。1邮政地址:沙特阿拉伯吉达市邮政信箱80221号61号楼s109室,邮编21589。沙特国王大学负责同行审查制作和主办:Elsevierhttp://dx.doi.org/10.1016/j.jksuci.2016.12.007为了有效地保护多媒体版权,数字水印技术应运而生。数字水印是指将水印(即标签,签名或版权)嵌入到几种类型的媒体中的嵌入过程。这些类型的媒体包括文本、音频、图像和视频。水印系统主要包括两个过程:水印的嵌入和水印的提取。当设计水印系统时,必须考虑一些基本要求,这些基本要求根据系统的使用而变化1319-1578© 2017作者制作和主办由爱思唯尔B.V.代表沙特国王大学。 这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词阿拉伯文本水印;容量;鲁棒性;不可感知性基于开放词空间的容量改进型阿拉伯文本水印方法237(Stankovic'et al.,2012;Cox等人, 200 7)。水印的关键要求是:容量,不可感知性,鲁棒性和安全性。容量是对象中隐藏位的总数。不可感知性用于通过注意原始对象的任何添加来测量原始对象和水印对象之间的差异。鲁棒性是指在水印对象受到攻击后提取或检测水印的能力。安全性要求是在不破坏水印对象的前提下提取水印的难度。在文本中创建隐藏水印是最困难的一种,因为与图像或音频文件相比,文本文件中相对缺乏不必要的信息人类对文本变化的敏感性高于对其他多媒体的敏感性。 任何文本更改都必须保留含义、准确性、写作风格和文本价值(Topkara等人,2006; Jalil,2010)。文本水印方法可以分为:行移编码、字移编码、语言方法、开放空间方法和其他基于语言特征的方法(Alotaibi和Elrefaei,2015)。在行移位编码中,行被向上或向下移位以隐藏“0“或”1”。在字移位编码中,字被水平移动以编码秘密比特。语言学方法旨在改变文本结构(句法方法)或文本内容(语义方法)(Bennett,2004)。开空格法是利用词与词之间、句与句之间或行与行之间的空白来表示存在的 隐 藏 比特的数量(Bender等人, 1996年)。本文的主要贡献是通过提出方法1和方法2两种阿拉伯文本水印方法来提高水印的嵌入容量,并测试了它们的鲁棒性。所提出的方法利用单词之间的开放空间,但不是使用Bender等人(1996)中的正常空间,而是使用小空间或没有宽度的空间。阿拉伯字母没有一种形式,但它们的形状取决于它在单词中的位置(Alotaibi和Elrefaei,2015)。伪空格是一种非打印字符,当它出现在字母之前或之后时,它迫使字母采用最终或初始形式。在单词的开头或结尾 使 用 它 不 会 改 变 单 词 的 形 状 。 Alotaibi 和 Elrefaei(2016)的研究人员将其插入正常空间之前,以指示隐藏的数据。在提出的方法1中,在常规空间之前和之后添加伪空间,以提供Alotaibi和Elrefaei(2016)中提出的方法的两倍的容量。方法2中,选取伪空间、薄空间、头发空间和零宽度空间四种空间添加到正常空间中,表2使用的空间。水印方法开放空间方法(Bender等人,一九九六年)伪空间方法(Alotaibi和Elrefaei,2016)建议的方法1建议方法2插入的空间NSPS位置插入字、行或句之间字之间PSPS、HS、TS单词之间单词之间提供非常大的容量。这些空格的存在用于隐藏位“1”,而它们的缺失用于隐藏位“0”。1.1. 使用空间概览提出的方法通过在正常空间中插入一些空格来将水印嵌入到阿拉伯文本中。所选空格及其Unicode(空白字符,2016)如表1表1还显示了在两个单词“之间使用这些空格来显示它们有多宽的示例垂直指针指示插入Unicode空格的位置。表2示出了方法中使用的空间(Bender等人,1996;Alotaibi和Elrefaei,2016)和所提出的水印方法。本文的其余部分组织如下:第二部分回顾了阿拉伯文本水印的相关工作。在第3节中讨论了所提出的方法。 实验进行评估的能力和不可感知性的方法,并比较它与五个阿拉伯文文本水印方法在第4.1和4.2节。所提出的方法的鲁棒性在第4.3节中的大多数现有的已知文本攻击下进行了测量。第五部分是全文的结论。2. 相关工作任何语言中的文本水印方法都利用该语言中的书写的特征或一般文本特征。阿拉伯文字有许多特点,如:开放空间,卡希达,变音符号和打点。开放空间是用于宿主文本中的数据隐藏的一般特征,如在Bender等人(1996)通过利用文本表1选择的空间。空间名称空间Unicode描述示例正常空间(NS)U+00至20用于分隔单词的伪空间(PS)U+200C强制将连接的字母分开精简空间(TS)U+20091/5(有时1/6)宽头发空间(HS)U+200A比稀薄的空间还要零宽度空间(ZWS)U+200B没有宽度238R.A.洛杉矶阿洛泰比埃尔雷法伊文档.空格的处理有三种不同的方式:句间空格、行尾空格和词间空格。句间间隔是根据句子之间的间隔,将秘密信息以二进制字符串的形式编码在文本上。它通过插入一个空格来编码“0”,或通过插入两个连续的空格来编码“1“。这种方法的缺点是容量低,因为每个句子中只有一个或两个比特编码。这种方法的滥用降低了其透明度。空白在行尾空格方法中得到了很好的利用,因为额外的空格被放置在行尾,这比以前的方法提供了更高的不可感知性。在行尾空格中,每行使用两个空格嵌入一个比特,使用四个空格嵌入两个比特,使用八个空格嵌入三个比特,以此类推,这种方法的使用在文本结构方面没有限制。然而,有些程序通过删除额外的空格来破坏隐藏的数据。在字间间距中,额外的空格插入两个连续的字之间。字之间的单个空格编码二进制位“0”,而两个空格编码二进制位“1”。Yang和Kot(2004)以及Huang和Yan(2001)提出了基于修 改词空间的文本 图像水印方法。 Yang 和Kot(2004)提出了一种基于嵌入规则的文本图像水印算法,将字符间的空格与单词空格相结合。此方法无法应用于阿拉 伯 文 文 本 , 因 为 其 字 符 是 连 接 的 。 在 Huang 和 Yan(2001)中,文本图像的行被认为是正弦波的采样点。水印嵌入在正弦波的频率、相位和幅度上。文本图像水印方法对复制粘贴和格式化操作的鲁棒性较差.使用OCR程序会丢失水印。此外,与直接处理文本的方法相比,阿拉伯语具有用于数据隐藏的独特属性。网点特性是最重要的特性之一。点位于一些阿拉伯字母的上方或下方。在Shirali-Shahreza和Shirali-Shahreza(2006)中提出的研究工作中,参考隐藏位向上移动点“1”或将其保持在其位置以表示位“0”。点属性也与伪空间一起使用,以利用Alotaibi和Elrefaei(2016)中的每个开放词空间。水印嵌入过程包括在单词空格前插入伪空格,伪空格不改变单词之间的空格和字母的形状。它 如 果 字空格前的字母被指向并且嵌入位等于“1”,则插入。如果字母是非尖的,并且嵌入位等于“0”,则也会插入。Kashida或扩展字符可以添加到文本中,表明存在秘密数据。用来通过引申词语来调整文字,不改变意思。Gutub等人(2007)的作者在水印过程中使用具有点属性的kashida。他们在包含点的字母之前或之后插入kashida以指示位1。它们还将其插入不包含点的字母之前或之后,以指示位0。在这种方法中,kashida以特定的模式插入,因此作者改变了插入过程以增加安全性。 在Gutub et al. (2010)在任何字母可以容纳它之后插入一个Kashida以表示比特零,并且插入两个连续的Kashida以表示比特一。在Alginahi等人。(2013)kashida被添加到6个字母之前,接受从右侧连接(阿拉伯语脚本被写入从右到左),前提是这些字母之前的字符接受在其之后插入kashida。Alginahi等人(2014)的研究人员使用了相同的先前机制,其中kashida被添加到特定的字母集合之前。他们根据字母的出现情况将阿拉伯字母分为两组。集合A包含较高频率,而集合B包含较低频率。他们发展了两种方法,第一种使用集合A,第二种同时使用集合A和集合B。基于kashida的方法的主要缺点是注意kashida的可能性和容量是可变的,取决于信的能力。为了扩展,它只插入在该词的某些地方阿拉伯语不包含元音,但它有变音符号或harakat。变音符号有助于单词的正确发音他们区分两个由相同字母组成的单词,但有不同的声音和意义。这些变音符号被用于隐写术和阿拉伯文本水印 领 域 一 些 方 法 ( Aabed 等 人 , 2007 年 ; Bensaad 和Yagoubi,2011年)显示或隐藏它们以表示“0“或”1“位。Shah和Memon(2011)以不同的方式使用变音符号通常的形式是用来表示一,和反1表示零。此方法需要特殊字体。基于变音符号的方法不是盲目的,它们在检测过程中需要原始文本。它们的容量取决于文本中变音符号的数量。在阿拉伯语文本中使用变音符号变得很少,因为它们可以通过解析文本来找到。在Shirali-Shahreza和Shirali-Shahreza(2008,2010)和Shirali-Shahreza(2008)中,波斯研究人员开发了一些方法来隐藏基于Unicode字符的阿拉伯语和波斯语文本中的数据。基于Unicode的方法使用具有特殊功能的字符在隐藏进程中使用。在Shirali-Shahreza和Shirali-Shahreza(2008)中,已经提出了一种新的隐写方法,该方法使用未连接字符之间的伪空间和连接字符之间的伪连接来隐藏比特“0“或”1”。这些添加不会影响文本的整体外观,但用于隐藏秘密数据。Shirali-Shahreza和Shirali-Shahreza(2010年)的作者在阿拉伯语和波斯语中使用了两个字符它们使用波斯字符隐藏位“0“,使用阿拉伯字符隐藏位”1”。在Shirali-Shahreza(2008)中,“ 0 ” 或 “ 1 ” 位 是 基 于 单 词 “ L a ” 的 两种 形 式 之 一 的 使 用 而 隐 藏 的 。“La”这个词可以通过按键盘上代表一个代码的一个按钮来写。该实现用于隐藏“0” 。 “La“ 字是通 过在两个字符 ”Lam“和”Alef“ 之间插 入kashida来隐藏”1”。基于Unicode的方法具有高透明度,但容量非常低,除了第一种方法。 它有很大的容量,但秘密位可能会受到影响 在提取侧。3. 提出方法基于开放空间的文本水印方法能够保持文本的语言和语法规则的完整性、清晰性和价值。单词和句子之间多余的空格基于开放词空间的容量改进型阿拉伯文本水印方法239输入:原始文本:OT,二进制格式的水印:W,尖字母集:P,未尖字母集:UP输出:水印文本j←0L←长度WC←长度OT对于i=2:C-1,如果Ci是间隔,则获取Ci;Ci-1;Ci 1如果n =Ci-12P且W1/2j]1/2,则在水印文本中Ci之前插入伪空格端否则,如果n =Ci-12UP且W1/2j]/40UP,则在水印文本中Ci之前插入伪空格端j←j1如果jPL,则端j←0如果n =Ci=12P且W1/2j]/41P,则在水印文本中的Ci之后插入伪空格端否则,如果n =Ci=12UP且W1/2j]/40UP,则在水印文本中的Ci之后插入伪空格端j←j1如果jPL,则端结束结束j←0return水印文本或在行的末尾,读者通常不会注意到。然而,现有的基于利用文本中的空白的方法遭受低数据插入容量。此外,经常使用正常空间可能会引起注意。本文提出了两种阿拉伯文文本水印算法,充分利用文本中的每个词空间,保证了较高的插入容量。词与词之间的空白处理是通过添加小空格或不宽空格来代替使用正常空格来满足不可压缩性要求。第一种方法,方法1利用点特征来提高Alotaibi和Elrefaei(2016)中提出的方法的能力。伪空格是波斯语中用于分隔同一单词的两个部分的非印刷字符。在Alotaibi和Elrefaei(2016)中,它被插入到正常空间之前,并且在所提出的方法1中,它被插入到正常空间之前和之后,基于正常空间之前的字符和之后的字符,无论它们是否指向。拟议的方法2可适用于阿拉伯文本或任何其他语文。3.1. 方法1第一个提出的阿拉伯语文本水印方法,方法1,提高了Alotaibi和Elrefaei(2016)中提出的工作的能力。在水印的嵌入和提取过程中,除了字母之前的空格之外,还要检查字母之后的空格。虽然伪空格没有宽度,并且它用于使字母看起来孤立,但它可以添加在阿拉伯语单词的开头或结尾,而不会产生任何视觉效果。3.1.1. 嵌入算法嵌入算法采用二进制表示的水印作为一个字符串的零和一作为输入的文本要加水印。为了得到水印文本,检查过程从右到左应用于空格之前的字母和空格之后的字母。如果字母匹配插入条件,则在字母和空格之间插入伪空格。读者找不到任何变化算法1. 方法1嵌入算法240R.A.洛杉矶阿洛泰比埃尔雷法伊输入:水印文本:WT,尖字母集:P,未尖字母集:UP输出:水印:Wj←0对于i=5:C-2,C←长度WT获取Ci;C i-1;C i-2;C i1;C i2如果Ci是间隔,则如果Ci-1是伪空间,则如果Ci-22P,则W½j]←1端结束else如果Ci-12P,则W½j]←0端否则,如果C1-22UP,则W½j]←0端端端否则,如果C1-12UP,则W½j]←1j←j1如果Ci= 1是伪空间,则如果Ci=2 2P,则W½j]←1端结束else如果Ci= 12P,则W½j]←0端否则,如果Ci=2,则W½j]←0端否则,如果Ci=12UP,则W½j]←1端端端j←j1端返回水印原始文本和水印文本之间的区别插入条件取决于水印位和字母状态,如算法1. 图1示出了方法1的一个例子,其中彩色字母表示在其之后或之前存在伪空格。如果我们以第二个空格为例,空格之前的字母是被指向的,并且水印位等于“0”,因此不插入任何内容。空格后的字母为“0”,水印位等于“1”,也不插入任何内容。3.1.2. 提取算法方法1是盲水印方法,因为提取算法仅需要水印文本来返回水印比特。提取过程检查伪空格和前一个和下一个字母的存在,以设置水-标记位为“1“或”0”。算法2示出了方法1中的提取算法。3.2. 方法2在方法2中,嵌入算法涉及使用表2中所示的四个不同的空间,与单词正常空间混合。不是所有的空格都被插入,只有与水印位匹配的空格才被插入。3.2.1. 嵌入算法水印比特流被分成组,每组长度为4比特。第一个比特对应于伪空间。第二位对应于薄空间。第三比特对应于头发空间。第四位对应于零宽度空间。然后,匹配每组中的每个位算法2. 方法1提取算法基于开放词空间的容量改进型阿拉伯文本水印方法241C←长度OT输入:原始文本:OT和二进制格式的水印:W输出:水印文本j←0L←长度W对于i=1:C,得到Ci如果Ci是间隔,则如果是,则在水印文本中Ci之前插入伪空格端如果是,则在水印文本中的前一个空格后插入精简空格端如果是,则在水印文本中的前一个空格后插入头发空格端如果是,则在水印文本中的前一个空格后插入零宽度空格端j←j4如果jPL,则端结束结束j←0return水印文本相应的空间。如果位等于“ 1 “ , 则 插 入 预 期 的 空格 , 否 则 如 果 位 等 于 ” 0 “ , 则 不 插 入 任 何 内容 。例如,如果组位等于如果组位等于“1111”,所有空间都被添加到普通空间,同时保持空间顺序。算法3中解释的嵌入算法步骤。图2示出了所提出的方法2的示例。3.2.2. 提取算法方法2可用于空格是书写组成部分之一的任何语言,而不仅仅是阿拉伯语。这种方法在不需要原始文本的情况下盲目地工作以提取秘密数据。和前面的方法一样,它搜索文本中的每个空格,并得到空格前的四个字符。每个单独的字空间编码四位。如果一个预定的空格在单词空格之前,图1方法1的示例。算法3. 方法2嵌入算法242R.A.洛杉矶阿洛泰比埃尔雷法伊匹配 与 其 位置 在 的 水印组算法4中详细说明了提取算法。算法4. 方法2提取算法。输入:水印文本:WT输出:水印:Wj←0C←长度WT对于i=5:C做得到Ci,Ci-1,Ci-2,Ci-3,Ci-4如果Ci是间隔,则col4¼Ci-4Ci-3Ci-2Ci-1col 3¼Ci-3Ci-2Ci-1col2¼Ci-3Ci-2Ci-1如果col4是PS,然后是TS,然后是HS,然后是ZWS,则W1/2j;4] ←端否则,如果col3是TS,然后是HS,然后是ZWS,则W1/2j;4]端否则,如果col3是PS,随后是TS,随后是ZWS,则W1/2j;4] ← 1101端否则,如果col3是PS,然后是HS,然后是ZWS,则W1/2j;4]端否则,如果col3是PS,随后是TS,随后是HS,则W1/2j;4] ← 1110端否则,如果col2是PS后接TS,则W½j;4] ← 1100端否则,如果col2是TS后跟HS,则W1/2j;4] ← 0110端否则,如果col2是HS后跟ZWS,则W1/2j;4] ← 0011端否则,如果col2是PS后接HS,则W1/2j;4] ← 1010端否则,如果col2是PS后接ZWS,则W½j;4] ← 1001端否则,如果col2是TS后跟ZWS,则W1/2j;4] ← 0101端如果col1是PS,W½j;4] ← 1000端否则,如果col1是TS,则W½j;4] ← 0100端如果col1是HS,W1/2j;4]端如果col1是ZWS,W1/2j;4] ← 0001结束elseW½j;4] ← 0000端j←j4结束结束返回水印基于开放词空间的容量改进型阿拉伯文本水印方法243表3Microsoft Windows操作系统文本文件大小分类(Kashyap,2010)。文本类别文件大小空0 KB微小0小型10中100 KB大1巨大的16巨大>128 MB图2方法2的示例。4. 结果和讨论为了评估所提出的方法在容量,不敏感性和鲁棒性方面,使用15个不同大小的文本样本进行实验。文本样本选自OSAC:开源阿拉伯语语料库(Saad和Ashour,2010)和AraCorpus(Indexof/AraCorpus,2010),具有从非常小的文 本 到 非 常 大 的 文 本 的 不 同 大 小 文 本 样 本 根 据 MSWindows OS 文 件 搜 索 大 小 属 性 进 行 分 类 ( Kashyap ,2010)。表3显示了基于Windows分类的文本类别。表4显示了所用文本样本的规格。水印的长度分别为:8bit、16bit、32bit、46bit、128bit和256bit,以考察水印长度与鲁棒性的关系。水印在每个文本样本中随机生成。所提出的方法已实现使用C#.NET编程语言。4.1. 不可感知性评价结果图3示出了阿拉伯语文本水印系统的GUI,其包括所提出的方法和其他六种阿拉伯语文本水印方法: 2007)、kashida方法(Gutub等人,2007)、增强的kashida方法(Alginahi等人,2013 )、增强的kashida方法A(Alginahi等人,2014)、增强的 kashida方法B(Alginahi等人,2014)和伪空间方法(Alotaibi和Elrefaei,2016)。如图3所示,kashidas用红色着色,后面或前面有伪空格的尖字母用红色着色,而非尖字母用黄色着色。所提出的方法1 和Alotaibi和Elrefaei(2016)中提出的方法具有比其他方法更高的不可感知性。由于使用了不可见字符伪空间,没有人能够区分原始文本和水印文本。 所提出的方法,方法1和方法2,比基于kashida和变音符号的方法具有更高的不可感知性。变音符号法(Aabed表4文本样本规格。文本样本类别文件大小(字节)字符总数字数1微小260145292微小465726644964小37,22220,63638175小82,46945,64777078介质692,668437,86086,0849介质839,936399,03876,03610介质992,340489,34693,5658大1,603,394860,748135,0329大5,014,2952,695,581456,29910巨大33,795,72518,244,8812,937,98911巨大50,477,21227,326,1944,415,78512巨大274,730,158148,163,62223,690,877244R.A.洛杉矶阿洛泰比埃尔雷法伊图3提出的阿拉伯文文本水印方法的GUI。例如, 2007年)提请注意,其中一些变音符号是存在的,而另一些则不是。4.2. 能力评价结果使用表4所示的前10个文本样本,拟定方法(方法1和方法2)的容量见表5。文本水印算法的容量是指嵌入到原始文本中的比特总数。容量比计算如下:隐藏位容量比率:总字符×100 Alginahi et:;2013年出于比较的目的,所提出的方法与六种方法(Aabed等人,2007; Gutub等人,2007;Alginahi等人,2013,2014;Alotaibi和Elrefaei,2016),如图4所示。容量结果所提出的方法高于这些水印方法。表6显示了使用十个文本样本的平均容量比较结果。这些文本样本摘自表4。平均值是每个文本容量的总和除以10 。 所 提 出 的 方 法 具 有 最 高 的 容 量 。 方 法 1 改 进 了Diacritics方法的容量( Aabed 等 人 , 2007 ) 、 kashida 方 法 ( Gutub 等 人 ,2007)、增强的kashida方法(Alginahi等人,2013)、增强的kashida方法A(Alginahi等人,2014)、增强的kashida方法B(Alginahi等人,2014年)和伪空间方法(Alotaibi和Elrefaei,2016年)约1852%,92%,535%,162%,百分之一百二十三和百分之一百零六分别的方法2的容量与以前的阿拉伯文水印方法相比分别提高了4405%、343%、1366%、505%、414%和377%。这些增长百分比是根据百分比变化变音符号方法(Aabed等人,2007)具有基于文本上的变音符号的可变容量。即使在使用如图3所示的全变音符号文本的情况下,方法1和方法2也具有比变音符号方法的容量更接近或更高的容量。现在,大多数电子阿拉伯语文本都没有变音符号。4.3. 耐用性评价结果对所提出的方法进行了测试,以评估其对大多数类型的文本攻击的鲁棒性。篡改攻击是最常见的文本攻击类型,尤其是在学术研究中。攻击者试图改变基于开放词空间的容量改进型阿拉伯文本水印方法245表5 所提出的方法的容量使用10个文本样本。文本样本方法1方法2容量(位)比例(%)容量(位)比例(%)14531.0311680284731.79198874.623362032.27812872.474709434.3715,26473.96514,35331.4430,82467.52629,01233.2564,40473.81743,08931.9193,93269.578113,29325.87304,23678.749138,69634.75344,80476.2410173,45335.44374,40876.51平均52350.232.212123810.474.344建议方法2建议方法1伪空间方法(Alotaibi和Elrefaei,2016)增强的Kashida方法B(Alginahi等人,2014年度)增强的Kashida方法A(Alginahi等人,2014年度)增强的Kashida方法(Alginahi等人,2013年度)Kashida方法(Gutub等人,(2007年)400000350000300000250000200000150000100000500000变音符号方法(Aabed等人,(2007年)文件大小(字节)图4使用十个文本样本的不同方法的容量比较结果表6使用10个文本样本的平均容量比较结果。水印方法使用的功能容量(位)容量比率(%)变音符号方法(Aabed等人,(2007年)变音符号72621.65Kashida方法(Gutub等人,(2007年)柏田25,60316.754增强的Kashida方法(Alginahi等人, 2013年度)柏田84675.07增强的Kashida方法A(Alginahi等人,2014年度)柏田20,51312.297增强的Kashida方法B(Alginahi等人, 2014年度)柏田23,44114.452伪空间方法(Alotaibi和Elrefaei,2016)PS24,84115.585建议方法1PS52,35032.212建议方法2PS、HS、TS和ZWS123,81074.344通过在原文中插入新的词语或句子或删除它们来修改文本 。 插 入 和 缺 失 过 程 以 两 种 方 式 进 行 : 局 部 或 分 散(Jalil,2010)。在我们的实验中,本地化插入是在一个地方的水印文本。这个位置可以在文章的开头或结尾,也可以在文章中间的任何地方。在分散插入中,单词或句子被随机添加到水印文本的几个不同部分。在本地化的dele-在这种情况下,这些句子和单词从水印文本中的一个随机位置被删除。分散删除是对水印最大的失真攻击,因为删除是在不同的随机位置从文本。图5示出了用于测试针对四种不同类型的攻击所提出的方法的鲁棒性的GUI:局部插入、分散插入、局部删除和分散删除。水印是嵌入在原始文本中的多个容量(位)246R.A.洛杉矶阿洛泰比埃尔雷法伊a)本地化插入攻击(插入的单词在输出文本中用红色着色)。c)本地化删除攻击(删除的单词在输入文本中被涂成红色)。b)分散插入攻击(插入的单词在输出文本中被涂成红色)。d)分散删除攻击(删除的单词在输入文本中被涂上红色)。图5用于所提出方法的稳健性测试的GUI基于水印和文本长度的时间来增加鲁棒性(Cox等人,2007年)。然后对水印文本进行攻击,最后从攻击文本中提取水印。鲁棒性的度量取决于水印在被攻击的水印短信了如果水印在被攻击的文本中被发现一次或多次,则认为它是存活的,否则它将丢失。使用表4中列出的不同12份文本样品检测拟定方法的耐用性。每个样本都使用水印长度进行测试:8,16,32,64,128和256。表7给出了测试文本攻击的测试场景及其结果。基于开放词空间的容量改进型阿拉伯文本水印方法247表7不 同 文 本 攻 击 的 测试场景和结果。攻击类型测试场景测试结果局部插入分散插入局部删除分散缺失复制和粘贴首先,用户输入插入百分比和水印文本。然后,基于插入百分比将单词/句子插入到水印文本中的一个位置。重复该过程,直到所提取的水印的次数改变。图5a示出了针对局部插入攻击首先,用户输入插入百分比和水印文本。然后,基于插入百分比将单词/句子插入到水印文本中的不同位置。重复该过程,直到所提取的水印的次数改变。图5b示出了针对分散插入攻击首先,用户输入删除百分比和水印文本。然后,基于删除百分比从水印文本中的一个位置删除单词/句子。重复该过程,直到所提取的水印的次数改变。图5c示出了针对局部删除攻击测试方法1的示例首先,用户输入删除百分比和水印文本。然后,基于删除百分比从水印文本中的不同位置删除单词/句子。重复该过程,直到所提取的水印的次数改变。图5d示出了针对分散删除攻击用户复制水印文本,然后将其粘贴到另一个程序中并保存,然后从保存的文件中提取水印。无论水印的嵌入率是多少,水印的嵌入次数等于水印的提取次数,因此该方法对局部插入攻击具有鲁棒性在方法1中,如果水印被嵌入3次或更少,则水印丢失,水印长度大于等于16的文本样本1和水印长度为256在方法2中,如果水印仅被嵌入一次,则水印丢失这不可能发生,除非在非常小的文本大小所提出的方法是强大的本地删除攻击使用中型和大型文本。水印仅在删除100%的文本的情况下丢失,这意味着删除所有文本。在方法1和方法2中,使用小尺寸文本破坏水印所需的删除百分比分别在97%和100%之间以及99%和100%之间。文本样本1和2用于表示微小文本。1号文本样本是一个非常小的文本,只包括29个字,这些字对水印来说并不重要。在小文本中,所需的删除百分比在0到100%之间变化,这取决于水印在被攻击之前在水印文本中重复的次数和水印长度对于中、大、巨、巨型文本,两种方法对水印破坏的分散删除率均为100%。在小尺寸文本中,分散删除百分比在方法1中为84%至100%,在方法2中为93%至100%。方法1的删除率为0 ~ 97%,方法2的删除率为0 ~ 100%。当水印嵌入的次数等于水印提取用户更改水印文本样式,如:字体样式,文本大小,颜色,突出显示和任何其他效果。然后,提取水印当水印嵌入的次数等于水印提取的次数时,所提出的方法对格式化攻击具有鲁棒性重新打字、打印和OCR用户重新输入或打印水印文本,然后扫描它。之后,OCR程序用于将扫描的打印文本转换为电子文本。最后提取水印所提出的方法依赖于伪空间的存在。该字符不打印,也没有任何宽度,因此所提出的方法对重新输入,打印或OCR5. 结论提出了两种利用每个词空间的阿拉伯文本水印方法。方法1专门用于阿拉伯文文本或类似语言,因为它利用了阿拉伯文打点特征。方法2可以用于任何使用空格分隔单词的语言。方法二的贡献在于利用了四种微小空间:伪空间、细空间、头发空间和零宽度空间与正常字空间。对所提方法的性能进行了测试,以评估其容量、不可感知性和鲁棒性结果,并与一些使用不同文本样本的六种水印长度的阿拉伯文本水印方法进行了比较。所提出的方法发现具有最高的容量和不可感知性。方法2具有最大的容量,但比方法1的不渗透性略低。该方法对复制粘贴、格式化、篡改等电子文本攻击具有较强的鲁棒性,篡改率高达84%。作为未来的工作,文本水印可以使用压缩算法,如霍夫曼算法,而不是使用二进制位来表示水印。在提出的水印方法中可以使用私钥来证明真实性。所提出的方法也可以结合其他阿拉伯文水印方法从文献。248R.A.洛杉矶阿洛泰比埃尔雷法伊资金这项研究没有从公共、商业或非营利部门的资助机构获得任何特别资助。引用Aabed,文学硕士,Awaideh,S.M.,Elshafei,A.R.M.,Gutub,A.A.,2007. 基于阿拉伯变音符号的隐写术。见:ICSPC 2007年 。 IEEEInternationalConferenceonSignalProcessingandCommunications,IEEE,pp. 756- 759Alginahi , Y.M. , Kabir , M.N. , Tayan , O. , 2013. 一 种 基 于Kashida的阿拉伯文文本水印算法。2013年国际电子、计算机和计算会议(ICECCO),IEEE,pp. 301- 304Alginahi,Y.M.,Kabir,M.N.,Tayan,O.,2014.一种增强的基于Kashida的水印方法,用于基于字符频率递归的阿拉伯文本文档的增强保护。Int. J. Comput.电子工程6(5),381。Alotaibi,R.A.,洛杉矶埃尔雷费2015.阿拉伯文文字水印:综述。arXiv预印本arXiv:1508.01485,pp. 1-16号。Alotaibi , R.A. , 洛 杉矶 埃 尔雷 费 2016. 利 用字 空 间与 指 出和unpointed字母的阿拉伯文文本水印。在:2016UKSim-AMSS第18届计算机建模和仿真国际会议,pp. 111- 116Bender,W.,Gruhl,D.,Morimoto,N.,Lu,A.,1996. 数据隐藏技术。IBM系统J. 35(3.4),313-336。Bennett,K.,2004.语言隐写术:在文本中隐藏信息的调查、分析和鲁棒性。普渡大学。CERIAS技术2004-13年报告.Bensaad,M.L.,Yagoubi,M.B.,2011.一种基于变音符号的大容量阿拉伯文本信息隐藏方法。在:信息技术创新国际会议(IIT),IEEE,pp。 433- 436科克斯岛,米勒,M.,Bloom,J.,Fridrich,J.,Kalker,T.,2007.数字水印和隐写术。摩根·考夫曼古图 布匿 名戒酒 协会 Ghelman 湖, Amin , A.A. , Alkharobi ,T.M. , Ibrahim , M.K. , 2007. 利 用 带 尖 字 母 的 扩 展 字 符“Kashida”实现阿拉伯文本数字水印。见:SECRYPT,pp. 329-332.古图布匿名戒酒协会Al-Alwani,W.,Mahfoodh,A.B.,2010.一种改进的基于扩展Kashida字符的阿拉伯文本隐写方法。BahriaUniv. J. Inf. Commun. Technol.3,68-72.黄,D.,杨,H.,2001.用正弦波表示的字间距离变化对文本图像进行水印。IEEE Trans. CircuitsSyst. Video Technol.11(12),1237-1245.Index of /2010. Aracorpus.e3rab.com. http://aracorpus.e3rab.com/argistestsrv.nmsu.edu/AraCorpus/? C=D;O=A(2016年访问)。Jalil,Z.,2010.利用数位浮水印之纯文字著作权保护(博士论文).国立计算机和新兴科学大学,伊斯兰堡。Kashyap ,V. ,2010.专业用户使用的7大Windows 搜索技巧,Makeofuse。http://www.makeuseof.com/tag/top-7-windows-search-tricks-sea
下载后可阅读完整内容,剩余1页未读,立即下载
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- BSC绩效考核指标汇总 (2).docx
- BSC资料.pdf
- BSC绩效考核指标汇总 (3).pdf
- C5000W常见问题解决方案.docx
- BSC概念 (2).pdf
- ESP8266智能家居.docx
- ESP8266智能家居.pdf
- BSC概念 HR猫猫.docx
- C5000W常见问题解决方案.pdf
- BSC模板:关键绩效指标示例(财务、客户、内部运营、学习成长四个方面).docx
- BSC概念.docx
- BSC模板:关键绩效指标示例(财务、客户、内部运营、学习成长四个方面).pdf
- BSC概念.pdf
- 各种智能算法的总结汇总.docx
- BSC概念 HR猫猫.pdf
- bsc概念hr猫猫.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)