心电信号生成长随机比特序列的密码应用研究

40 浏览量更新于2024-01-27 收藏 1.04MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报利用心电信号作为熵源高效生成长随机比特序列Md Saiful Islam沙特国王大学计算机与信息科学学院计算机科学系，利雅得11543，沙特阿拉伯阿提奇莱因福奥文章历史记录：2021年7月3日收到2021年12月15日修订2022年1月2日接受2022年1月22日在线提供保留字：真随机数密码学熵源心电信号A B S T R A C T长期以来，人们一直将心脏产生的心电信号作为一种潜在的熵源用于密码随机比特的产生现有方法的吞吐量为了克服这个问题，我们开发了一个伯努利熵源处理一个单一的心跳心电信号，以获得一个长的随机位序列（RBS）。所提出的方法将信号转换成一个IID（独立同分布）的熵源，使用有效的插值和优化技术。从两个不同的数据库中获得的几个心跳信号被用来测试产生具有100万比特的RBS的熵源根据NIST最新的IID源验证建议对熵源进行了评估，并通过了所有推荐的测试，从不同个体的几个心跳信号中获得的平均最小熵接近完美的熵值1.0。同时还观察到熵随密钥长度的增加而单调增加。所提出的方法可以有效地产生一个长RBS的密码应用，如密钥生成一次一密和图像加密。该方法可以进一步探索以产生具有个性化签名的真随机©2022作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍在即将到来的计算时代，设想使用具有个性化签名的真随机数在诸如一次性密码本（OTP）（Argyris等人，2016; Manucom等人，2019 ），图像加密（ Nguyen et al. ， 2020; Sivaraman 等人，2020）、无线体域网安全（Camara等人，2019; Karthikeyan和Manickam ， 2019; Pirbhulal 等人， 2018 年 ; Zheng 等人，2017），以及植入式医疗器械的保护（Chizari和Lupu，2019;Zheng等人，2015年）。一个真正的随机数发生器缩写：OTP，一次性密码本; IID，独立和相同分布; RBS，随机比特序列; ECG，心电图;IPI，脉冲间间隔; HRV，心率变异性; TRNG，真随机数生成; DRNG，确定性随机数生成;PVS，基于生理值的安全性。电子邮件地址：saislam@ksu.edu.sa沙特国王大学负责同行审查从基于具有固有随机性的物理过程的熵源获得数字事实上，一个正确的熵源被认为是一个真正的随机数发生器的基石。经常使用的熵源包括噪声（例如，电、热、环境噪声），抖动（例如，时钟，相位），混沌，量子效应（例如，多光子发射、分束器端口轴未对准、非理想圆偏振），以及生物电信号（例如，心电图、脑电图和肌电图）（ Kaya ， 2020a;Kaya ， 2020b;Kaya 等人，2021;Stipcevic′and Kobalovi ， 2014;Wuetal. ， 2021;Yu 等人，2019）。从生物电信号生成真随机数的新趋势主要出现在无线体域网中（Arslan Tuncer和Kaya，2018; Camara等人，2019; Camara等人，2018年; Chen等人， 2012 b; Pirbhulal等人， 2018年; Zheng等人，2017年）。在用作熵源的生物电信号中，心电图（ECG）信号由于其在生成具有用于生物特征认证的个性化签名的随机数中的潜在用途而受到关注（González-Manzano等人，2017; Karimian等人，2019;Lyp等人，2021）和密码学（Chen等人，2012 a; Hamad等人，2017;Islam，2015）.https://doi.org/10.1016/j.jksuci.2022.01.0011319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comMd Saiful Islam沙特国王大学学报5145×1.1. 相关作品ECG信号已经成为一种生物识别模式（AlDuwaile和Islam，2021;Islam和Alajlan，2016; Islam等人， 2012年; Wu等人，2021 b）的唯一性，稳定性，普遍性，鲁棒性，可收集性，可接受性和活性特性，这也是生物特征密码学的噪声源的理想特性（Chizari和Lupu，2019;Ramli等人，2013年）。生物特征密码学已经被研究用于不需要密钥交换协议的基于生理值的安全（PVS）解决方案（Venkatasubramanian和Gupta，2010）。它可能是可行的，因为它不像公钥加密那样需要资源，并且它比对称加密具有更高的安全性（Chizari和Lupu，2019）。因此，从ECG信号生成的随机密钥可以在密码学中引入对许多应用有用的新维度。现有的研究主要集中在利用心电信号的脉冲间间隔（IPI）值来产生随机比特序列（RBS）。尽管Ortiz-Martin等人（2018年）报告心跳的IPI值不是随机性的良好来源，但在2020年晚些时候，他们发现八位IPI值的特定位组合对于RBS生成是可行的（Ortiz-Martin例如， 2020年）。他们使用NIST800-90B建议的非IID（独立和同分布）轨迹（Turan等人， 2018年），并发现从五位的几种组合中生成的RBS可以通过一些测试。在（Chen et al.，2012 b; Chizari和Lupu，2019; Pirbhulal等人， 2018年）。相反，一些研究人员使用从心跳信号中提取的其他特征来获得更高的比特数。例如，Zheng等人（2017）使用五个特征值的二进制表示来获得128位的字符串，Camara等人（2018）使用小波系数的量化来从单个心跳中获得184位。在所有这些研究中，RBS的所需长度可以通过根据密码协议的要求附加来自连续心跳的位串来实现尽管现有的过程可能适合于RBS的长度相对较小的应用，但是当所需的序列长得多时，它们是不这是因为捕获ECG信号所需的时间可能相当长，如表1所示。例如，对于128128 Gy-scale图像，现有的基于IPI的方法可以采用只要4.55小时就可以生成密钥。因此，RBS生成过程的吞吐量对于在短时间段内需要长RBS的许多应用可能是不够的。此外，从IPI和其他特征生成的比特序列可能不是相同分布的，并且所产生的密钥可能具有较低的熵。据我们所知，所有现有的方法generating RBS从ECG信号已使用非IID轨道进行了评估1.2. 贡献在本文中，我们提出了一种方法，使用一个单一的心跳心电信号作为噪声源，并将其转换为熵源，以产生一个长RBS与高吞吐量，使生成的比特序列遵循均匀分布，以最大化的熵。与Killmann和Schindler（2001）的建议相反，我们从噪声源产生整个序列，使用真随机数生成（TRNG）来生成种子，然后使用确定性随机数生成（DRNG）来获得RBS。我们的方法的主要优点是可以检查心跳信号所具有的随机序列的生物特征（AlDuwaile和Islam，2020; Islam和Alajlan，2015）。我们使用来自两个不同数据库的几个心跳测试熵源以生成一百万比特，并使用最新NIST推荐的IID跟踪假设对其进行评估（Turan等人，2018年，它通过了所有测试。本工作的主要贡献如下：i. 开发一个伯努利熵源：我们已经开发了一个由一组独立的二进制随机变量组成的伯努利过程的熵源。我们用插值技术处理了从一小段心跳信号中得到的心电信号。将从插值样本获得的比特串与熵源映射以产生RBS。ii. 开发IID熵源：我们已经通过使用优化技术开发了IID熵源，以增强所生成的RBS的分布均匀性。这是重要的，因为均匀分布增加了源的熵以增强安全性。据我们所知，没有现有的工作RBS生成使用ECG信号满足所有测试IID假设。iii. 高吞吐量的熵源：我们使用高效的三次样条插值将一小段ECG信号转换为熵源，以获得长RBS。吞吐量主要取决于捕获ECG信号片段所需的时间，完整的心跳可能需要不到一秒的与现有方法相比，这是一个显著的改进，因为现有方法的吞吐量不适合于许多应用，如OTP和图像加密。1.3. 纲要本文的其余部分组织如下。在第2中，提出了所提出的方法。在第3节中，描述了数据集和实验结果。第4节中给出了关于所得结果的讨论。第5节总结了未来可能的工作。表1使用现有IPI和基于特征的方法生成密钥的时间要求应用所需密钥长度（最小值）IPI（Chizari和Lupu，2019）基于微生物学的（Zheng等人，（2017年）所需HB数量+所需时间*所需++所需时间*WBAN、IMD128位16 + 117秒11秒OTP（用于1000 ASCII字符的文本）8000位1000 + 11001秒6363秒（16.68分钟）图像加密（128× 128，灰度）131，072位16，384 + 116，385秒(4.55h）的10241024秒(17.1min）*假设每次心跳为1 s，即60次心跳/分钟。+假设生成8位/IPI。++假设128位/心跳。Md Saiful Islam沙特国王大学学报51462≤ ≤！ f···gjii2. 方法在本节中，我们描述了通过使用ECG信号的一小段作为噪声源来描述熵源的开发过程。首先，我们讨论了ECG信号的随机性及其作为噪声源的适用性（2.1小节）。熵源被描述为伯努利随机过程，通过对噪声源的数字化和重构，以及量化样本与离散随机变量的非线性映射，得到了一种新的非线性滤波器。我们没有使用任何任选的调节组分（Turan等人，2018年）。在2.5小节中，我们讨论了所提出的方法的吞吐量和计算复杂度。2.1. ECG信号作为噪声源ECG信号是心脏电活动的反映，可以在身体表面上无创地测量。心脏产生的电信号是半周期性的，一次完整心跳所需的持续时间也是随机的。这种心率变异性（HRV）是一种自然过程，与呼吸、血压、体育活动和精神压力等不同疾病相关（Sörnmo and Laguna，2005）。心脏的动态性质使其成为真正RBS生成的潜在噪声源。虽然不同人的心脏产生的信号之间存在很大的个体间差异，但HRV也引入了心跳的时间和形态学特性的个体内变异性（Islam和Alajlan，2013 b）。图1示出了来自同一个体的两个心跳，形态学（如R峰振幅）和时间特征（如P-P持续时间）的个体内差异。在正常窦性心律期间，完整心跳的信号包含三个主要分量：P波、QRS波群和T波。通常，心跳以对应于心房收缩的P波开始，随后是表示心室收缩的QRS波群，最后，心跳以表示心室舒张的T波结束。可以注意到，健康人的心跳持续时间从0.6到1秒不等，QRS波群的振幅比P波和T波的振幅大得多。我们考虑使用一小段包括一次心跳的信号的ECG信号（例如，P-P段）作为噪声源。我们将ECG段作为噪声源处理，并将其转换为熵源，该熵源产生具有应用所需长度的RBS。Fig. 1.来自同一个人的两个分段心跳信号，显示所有形态学元素和个体内变异性。2.2. 伯努利过程我们将熵源定义为具有一组n个独立且同分布的二进制随机变量{X1，X2，... Xn}，产生长度为n的RBS序列。该过程生成具有j10s和（n-j）00s的序列X的概率可以用二项分布来描述PXjj。n PX<$1 jPX <$0 n-j1这些随机变量中的每一个的均匀分布，即P（X i= 1）= P（X i= 0）; i= 1. n最大化所生成的RBS的熵。因此，为了获得产生具有最大熵的长RBS的IID熵源，需要满足以下条件：i) 可以从噪声源获得任意大的比特数ii) 当n很大时，10 s和00 s的期望数相等，即n（Xi= 1）=n（Xi=0）。iii) 所有随机变量的概率分布是独立的，即。P（X 1，X 2，. X n）= P（X 1）P（X 2）. P（X n）。由于心跳信号f（t）; 0t T（其中T是心跳的持续时间）是连续信号，所以通过应用采样和插值技术总是可以获得任意大数目的样本，并且通过样本的量化获得比特序列的期望长度。为了得到n 从一个连续信号的位，我们定义一个函数E：fX1;X2;;X n ，其将噪声源f映射到n 二进制随机过程图2示出了所提出的将噪声源映射到熵源上的方法的步骤，该熵源产生长度为n的RBS。开发过程的五个步骤如下所述。步骤1：数字化对于数字信号处理，通常以恒定采样率s对连续ECG信号进行采样，该采样率不小于由信号的有用带宽确定的奈奎斯特速率。对于持续时间为T的ECG段，连续信号f（t）的数字表示（0≤t≤T）产生r个样本，其中r=T×s。每个样本的幅度a iR，i = 1. r是真实的和有限的。步骤2：去除R峰这些r样本中的大多数的值被R峰的大幅度抑制，R峰是窄但陡峭的QRS波群的峰。因此，去除窄行QRS波群的顶部（即，R波）可以增加从信号的剩余部分获得的样本分布的均匀性，从而产生更均匀分布的样本。因此，我们使用一个简单的优化技术来获得最均匀的分布（在2.3小节中讨论）。步骤3：插值三次样条插值技术与优化步骤相关联地使用，以获得在0-2 m级的范围内尽可能均匀的插值样本的分布实际上，优化过程将信号f分成两个段，并且分别对每个段进行插值，从而总共产生一组p个插值样本，如在子节2.3中详细讨论的。步骤4：量化为了从由p个内插样本表示的ECG段获得n个随机二进制值的序列，我们使用量化技术来产生它们中的每一个的mp和m的值取决于应用程序所需的位数（n），使得n=p×m。首先，每个样本的幅度ai2R，i =1. p是有限的实数，被归一化到范围Md Saiful Islam沙特国王大学学报5147B-b我2数字化R峰去除插值量化映射{X1，X2，噪声源熵源图二.所提出的从ECG信号片段的熵源发展过程的框图。[0然后，对于m位量化，每个归一化样本乘以2m，如下所示lation技术。三次样条插值是一种广泛使用的方法，仅需要四个参数即可在一对样本之间定义连续的三次多项式函数（Revesz，2014）。我们可以使用多项式函数在它们之间插入任意数量的样本。以这种方式，我们可以获得在由r个样本定义的r1个间隔中相等地划分的q个样本，每个样本可以由等式（1）量化。（2）获得n比特RBS。然而，通过该过程获得的大多数q样本的值被R峰的大幅度抑制，R峰是窄但陡峭的QRS波群的峰。因此，我们认为，如图3的左列所示，量化为2m个离散级的所获得的采样的分布主要集中在具有小标准偏差的小区域中，并且平均值移向零而不是0-2 m范围的中间这些量化样本的二进制表示产生比一更多的零，从而产生二进制随机过程的非均匀分布。因此，去除窄QRS波群的顶部（即，R波）可以增加从剩余部分获得的样品分布的均匀性，Maiai×22步骤第五章：每个量化样本（a）的二进制表示产生m位二进制串。因此，这些字符串的连接亲-引入n个随机比特{b1，b2，.. . ，bn}，其中bi{0，1}。通过映射n个随机值得到伯努利过程{b1，b2，.. . ，b n}到n个随机变量{X1，X2，. Xn}，通过使用如下的非线性映射过程（在2.4小节中讨论）：M：b i！ X j; 1 ≤ i; j ≤ n<$3<$2.3. 插值和均匀性优化众所周知，通过以高于奈奎斯特速率的速率采样而获得的数字信号可以通过内插重建图3.第三章。优化过程对使用4位、6位和8位量化的样本分布的影响主要步骤Md Saiful Islam沙特国王大学学报5148b我b我. . b不合格品≤≤合格品←>≤ ≤该信号产生更均匀分布的样本。因此，我们使用一种简单的优化技术，使得我们可以通过仅移除R波的一小部分来获得所获得的样本的最均匀分布。为了去除R波的顶部，我们首先使用（Islam和Alajlan，2013 a）中描述的有效方法检测R峰。然后，还通过使用（Islam和Alajlan，2014）中描述我们使用迭代优化过程来选择以R峰为中心的最佳窗口w*，使得在去除该部分之后，然后信号的剩余部分的插值产生q个样本，使得它们的分布在量化级别0-2 m的范围内为了优化量化样本a的分布的均匀性，我们最小化差异P（a）的方差（var），以去除具有不同窗口大小（w）的QRS波群的顶部wω参数最小值P a我; 1 i年q4W我们考虑信号的窗口（w），以R峰为中心，随着大小的增加，直到窗口的半径等于Q-S段的长度。然后我们排除窗口，重新采样信号的剩余部分，并计算变量。所获得的样本a的分布P（a）的方差。我们选择这些p个样本，如由Eq. （2），产生n位二进制序列{b1，b2，. . ，bn}。2.4. 映射我们使用非线性映射过程将数字化和量化的样本与随机变量相关联。映射过程不改变比特的数量及其分布，并且生成的序列的熵也不改变。映射过程的重要性在于，它将减少由于内插和量化过程而获得长重复连续性的机会，因为获得具有相同值的连续样本的概率将随着n值的增加而增加。由于我们只使用了确定性运算，所以这个过程是可逆的，并且序列可以完全恢复以验证签名。算法如下：算法映射（{b1，b2，.. . 、bn}、c）输入：二进制序列{b1，b2，.. . ，b n}，c是常数输出：随机过程{X1，X2，. X n}对于j1到c，开始 1. 将n比特序列分成两个相等的子序列，一个比一个窗口W*，使得去除它产生最小变化。图中右侧图3显示了优化过程对通过4位、6位和8位获得的样本分布的影响序列并交换序列，如下所示：8>bik=2ifi6k=2量子化全局优化的使用是可行的，因为最大可能的窗口大小受QRS波群的长度限制，QRS波群的长度仅是信号的一小部分biji¼1;... ;k¼bi-k=2，如果i>k=2：bi，如果i¼k=2× 2：ð5Þ图4（a）示出了归一化之前的ECG信号的片段和通过优化过程选择的信号的窗口。图4（b）显示了在不移除窗口的情况下重建和正常化后的节段。图 4（c）显示了seg-2. 这两个序列通过如下从每个子序列中获取替代样本来合并（bi21如果i是奇数移除窗口，但不进行恢复和归一化。接下来，将段划分为两个子段fpq（P-Q段）和fst（S-T段），其中r为1，r为2biji¼1;... ;k¼=bik=2如果i是even：ð6Þ样本，其中r1+r2r.划分的子段fpq和fst是噪声源f的有用部分的离散表示。由于原始函数的采样率高于奈奎斯特采样率，因此我们可以通过称为分段均匀重采样的重采样过程获得任意数量的样本[30，34]。再采样过程分别从fpq和fst产生ppq和pst样本，使得p =ppq+pst。样本的振幅a i2 R; i = 1. . p;是有限的和真实的，它被归一化（a i）到范围[0 -1] ，如图所示。 4（d）. 的量化3. n比特序列（或可能的最大部分）是重新塑造成一个正方形矩阵。矩阵转置，然后第i行与第（i+j）行4. 所得到的矩阵再次被重新整形以将其转换成n比特的序列{b01，b02，. . . ，b0n}。5. bi=b0i;0in端6. Xi<$bi;1≤i≤n：见图4。(a)具有所选窗口w * 的P-P分段心跳信号（噪声源），（b）没有去除窗口的内插样本，（c）去除窗口之后的信号，（d）去除窗口之后的内插和归一化样本Md Saiful Islam沙特国王大学学报5149×2.5. 吞吐量和计算复杂度吞吐量可以定义为RBS生成器在单位时间内产生的比特数由于生理约束，对于健康个体，P-P段的捕获时间可以高达1因此，基于心跳信号的RBS生成系统的吞吐量取决于两个因素：i）心跳的持续时间和ii）计算复杂度。在这项工作中，我们需要一个单一的心跳信号作为噪声源和捕获时间是最小的相比，现有的方法。事实上，通过我们的方法，我们可以使用相同的ECG信号段任意增加n因此，所提出的方法的计算复杂度是具有高吞吐量的有效RBS生成的重要因素。在插值和均匀性优化过程中，我们首先使用O（r）算法检测R峰，其中r是信号中的样本数，其受到采样率的限制然后，迭代优化过程在每次迭代时对信号进行插值由于使用全局优化过程，迭代次数（p）很小，并且受到QS段长度的限制，QS段长度是r的一小部分。通过使用三次样条函数，我们可以在O（pq）时间内获得q个样本由于p是r的一小部分，O（r）可以忽略不计，因此该过程所需的总时间为O（q），与样本数q成线性关系。映射算法的六个步骤中的每一个都是一次迭代的线性时间操作。通过仅对恒定数量的迭代应用这些操作，混洗过程保持线性时间操作。虽然n很大，但对于特定的应用，它是有界的，并且所提出的方法的总计算成本变成线性的。因此，即使长时间RBS。3. 实验和结果最近，NIST更新了其使用物理过程生成密码位的熵源根据该推荐，称为NIST 800- 90 B（Turan等人， 2018年），熵源的测试可以进行有两种不同的轨道：IID轨道和非IID轨道。IID轨用于产生独立且相同分布的样本的熵源，而非IID轨用于不产生IID样本的熵源如第2所讨论的，所提出的伯努利熵源由n个独立且同分布的随机变量组成，以产生n比特的IID样本序列，并且我们将熵源评估为IID轨道。在密码学中，密钥的不可预测性至关重要。在第一次尝试中正确猜测秘密的概率与由噪声源产生的秘密的熵有关，并且不可预测性随着熵的增加而增加。NIST建议使用一个非常保守的测量方法，称为最小熵.独立离散随机变量Xi的最小熵定义为：从集合{0，1}中取值，概率为P（Xi= 0）=p0和P（Xi= 1）=p 1H1/4-log2最小值p0;p1最小值7在第3.1小节中，我们总结了IID轨道的验证过程我们使用两个不同的数据库进行验证。在3.2小节中，我们描述了数据库和实验方案。第3.3和3.4小节分别给出了这两个数据库的验证结果最后，小节3.5示出了来自不同ECG记录的心跳信号的熵和不同吞吐量的熵。3.1. IID-Track的熵源验证如NIST 800- 90 B所推荐的，需要从熵源收集至少一百万比特的序列以用于验证过程。在这项工作中，产生的序列使用统计测试对n个二进制随机变量进行测试，以验证IID假设，如果它通过了所有测试，则被接受为RBS。对所生成的比特序列执行三组不同的统计测试：i）排列测试，ii）卡方统计测试，以及iii）重启测试.在下面的三个小节中讨论的这些测试中的每一个如果假设被任何检验所拒绝，则认为该序列非IID。表2PTB数据库的排列测试。i测试量化级别名称4位6位8位Ci，0Ci，1Ci，0Ci，1Ci，0Ci，11偏移检验统计量304035030898502定向天线9032183058285650353定向天线的长度691420337179191225230334增加和减少243925714930595145基于中位数的平均数2308583366757856基于中位数的长度585114265091299524917547平均碰撞测试统计175911712187348最大碰撞测试统计24101150776755211728159周期性检验统计量（log = 1）15381950963014121310周期性检验统计量（log = 2）9428579981921182511周期性检验统计量（log = 8）12941562852338982712周期性检验统计量（log = 16）13362179191991221013周期性检验统计量（log = 32）39691964441417942714协方差检验统计量（log = 1）64273319184298515协方差检验统计量（log = 2）880532440108259016协方差检验统计量（log = 8）97881657859820017协方差检验统计量（log = 16）465565238312418协方差检验统计量（log = 32）95534467746156719压缩测试统计排列测试评估8681通过181515通过182166通过44Md Saiful Islam沙特国王大学学报表515051502-L-1p1-puPTB数据库的卡方统计检验。i测试量化级别名称4位6位8位检验统计量临界值检验统计量临界值检验统计量临界值（T）（Cv）（T）（Cv）（T）（Cv）1独立性检验961.51167.41926.92249.42057.32249.42拟合优度检验3最长重复子串检验的长度（P的阈值为0.001）卡方检验评估4.4P= 0.81通过27.911.8P= 0.89通过27.99.2P= 0.322通过27.93.1.1. 置换检验排列检验由表2和表6中列出的一组11个统计假设检验组成。给定一个输入比特序列，每个测试生成一万（10，000）个排列，原始序列的测试统计量为有参数j=（n-w-1），成功概率ps=（p2+（1-p）2）w，其中p是序列中10s个数的概率。然后，测试通过，如果PX≥1 1- 1-pj≥ 0： 001： 10与每一个排列相比两个计数器初始化为对于零，使用Ci，0和Ci，1（其中i是测试的索引以找到原始测试统计量在每个测试统计量中的排名。当第i次测试的排列的统计值大于或等于原始序列的值时，Ci，0和Ci，1的值如果样本是IID，它们的检验统计量应相似，I类错误概率不应超过0.001。因此，计数器的极值表明位不是IID，并且应满足以下条件以通过每个测试：Ci;0<$Ci;1>5和Ci;0 9995<$8<$<3.1.2. 卡方检验卡方检验由三个统计检验组成，如独立性检验、拟合优度检验和最长重复子串长度检验，如表3和表7所列。独立性测试通过将m位元组的频率与其预期值进行比较来检查序列中连续位之间的依赖性。如果卡方检验统计量当Ⅰ类误差取0.001时，当自由度为2m-2时，T小于临界值Cv拟合优度测试试图检查1的分布在整个位序列中是否保持相同。这里，检验统计量（T）是具有9个自由度的卡方随机变量与独立性检验类似，如果T小于I类误差0.001时的临界值（Cv），则检验通过，即3.1.3. 熵估计和重启测试如果比特序列通过所有排列和卡方测试，则使用最小熵估计来估计初始熵，该最小熵估计使用最常见值估计来确定（Turan等人，2018年）。该方法首先找到比例P= max（p，1p），其中p是给定序列中1的概率。置信区间的上限用于估计源的每个样本的最小熵：p1/4min0@1;bp2：57 6s2/bp1/2。ﬃﬃ1ﬃﬃﬃﬃ-ﬃﬃﬃﬃﬃpbﬃﬃﬃΣﬃﬃ1Að11Þ其中2.576对应于Z（1-0.005）值。那么最小熵（HI）的初始估计为HI1/4-log2μp，12μ m如果噪声源在重启后生成相关序列，则源的估计熵可能提供过度估计。重启测试使用来自噪声源的多次重启的不同输出来重新评估熵估计。这确保了重新启动序列中的位是从相同的分布中提取的，但它们是独立且不相关的。这将阻止攻击者（访问多个噪声源的输出序列）预测下一个输出序列。对于重启测试，我们使用1000个不同的心跳，从每个心跳中收集1000位。此数据存储在1000× 1000重启中TCvð9Þ矩阵M，其中来自心跳的样本存储在一行中。然后进行两个测试：i）健全性检查，和ii）验证length-of-the-longest-repeated-substring测试检查最长重复子串的长度是否明显长于预期值，这使得IID假设无效假设w是给定的长度为n的比特序列中最长重复子串的长度，Xi是二项分布的随机变量，表4test.正常性检查测试矩阵M的行和列中最常见值Xmax的频率。如果该频率显著大于预期值P（X>Xmax），则给定初始熵估计H1，重启测试失败并且序列被认为是非IID的。将I类错误的概率设置为0.01，每个二项式实验的误差为a，如果满足以下条件，则测试通过PTB数据库熵的初始估计。记录#量化水平1×000。1000日元最大值J1000-j如果随机位序列通过健全性检查，则执行验证测试。构建了两个数据集：i）通过连接行来构造行数据集，以及ii）通过连接M的列来构造列数据集。然后，对行（Hr）和列（Hc）的熵进行了估计PX>X最大值≥a≤13μ m4位6位8位记录10.86640.81590.8778记录20.90850.92090.8659记录30.84360.92040.9171平均HI0.87280.88570.8869Md Saiful Islam沙特国王大学学报5151数据集。如果Hr和Hc的最小值大于HI的一半，则确认测试通过。源的最终熵评估（H）变为行、列和初始评估中的最小值，即，H14 minHr;Hc;HI≤14min3.2. 数据库和实验方案我们使用了两个数据库来评估我们的方法。第一种被称为PTB（ Physikalisch-Technische-Bundesan stalt ），其在 Physionet（Goldberger等人，2000年）。该数据集包含以1000 Hz的采样频率从290个年龄从17岁到87岁的个体收集的60 s ECG记录。我们还使用了从手指捕获的ECG信号的内部数据库（Islam等人， 2017年）。该数据集包含来自164个个体的656个ECG记录，这些个体在两个不同的情况下收集。我们使用市售的基于手指的ECG设备以250 Hz的采样频率从受试者的拇指我们使用这两个数据库独立地测试和评估了所提出的方法。首先，我们检查了所有的记录，并排除了那些在捕获时间内被噪声对于测试和初始熵估计，我们使用每个数据库的前五个记录为了评估IID假设，从这些ECG记录中随机选择一个心跳（P-P段），并通过第2中讨论的方法从中生成100万位。心跳的提取样本的数量取决于量化级别。对于4位、6位或8位量化，分别收集了250 000、这些样本中的每一个被相应地量化，然后被混洗以获得随机序列。然后，进行排列和卡方检验。对于初始熵估计，我们使用从前五个记录中随机选择的三个心跳并计算最小熵，并且这些估计的平均值被用作初始估计HI。然后，对于重启测试，我们使用从不同ECG记录中收集的1000个心跳信号，并从每个记录中收集1000位。我们对从每个心跳中收集的位应用越来越多的迭代进行洗牌操作，并进行了完整性检查和验证测试。最后，对初始熵估计进行更新以获得最终熵。在第3.3和3.4小节中，我们提出了所有这些测试的实验结果分别使用PTB和FEGG数据库。3.3. PTB数据库的验证结果本节介绍了使用PTB数据库对IID轨道进行熵源验证的结果。表2示出了针对三个不同量化级别的十一个置换测试的测试统计（Ci，0和Ci，1所有测试均通过满足等式中给出的标准。（八）、可以注意到，对于周期性检验统计量和协方差检验统计量，使用了五个不同的对数。表3显示了不同量化水平的三个卡方统计检验的结果，所有检验均通过满足第3.1.2小节中讨论的标准。示出了分别从三个不同ECG记录获得的三个不同心跳的熵的初始估计和平均熵表4.重启测试和更新熵估计的结果如表5所示。值得注意的是，健全性检查和确认测试通过了第3.1.3小节中讨论的标准3.4. FECG数据库本节介绍了使用FECG数据库对IID跟踪进行表6示出了针对三个不同的量化级别的十一个置换测试的测试统计（Ci，0和Ci，1（八）、与之前一样，对于周期性检验统计量和协方差检验统计量，使用了五个不同的对数。表7显示了不同量化水平的三个卡方统计检验的结果，所有检验均通过满足第3.1.2小节中讨论的标准。从三个不同ECG记录单独获得的三个不同心跳的熵的初始估计和平均熵在表8中示出。重启测试和更新熵估计的结果如表9所示。可以注意到，健全性检查和确认测试通过了第3.1.3小节中讨论的标准。3.5. 熵和吞吐量我们从两个数据库的前五个记录中随机选择三个不同的心跳（HB-1，HB- 2，HB-3）计算熵我们使用8位量化提取了一百万位来计算熵。然后，我们计算每个记录的平均熵，如表10所示。我们还测试了从两个数据库的ECG信号的前五个记录中随机选择的三个不同心跳的吞吐量。从同一心跳中，我们提取了不同长度的比特序列，从1到10百万比特/心跳。然后，对于特定长度，我们计算了每个量化级别的三个心跳的RBS的平均熵，如表11所示。由于计算时间并不重要，我们假设吞吐量等于RBS的长度，将单次心跳ECG信号的总捕获和处理时间视为1秒。4. 讨论我们测试了一个单一的心跳ECG信号作为IID源的熵RBS生成分别使用不同的重采样率和量化水平为两个不同的数据库。从第3.3和3.4小节中可以注意到，从两个数据库生成的位序列通过了所有置换、卡方和重启测试，测试结果与临界值之间具有良好的裕度例如，对于偏移检验统计量（表2），Ci，0和Ci，1的值分别为8985和0，而Ci，0+Ci，1的阈值为5（下限），Ci，0的阈值为9995（上限），如公式（8）所示。我们测试了来自两个数据库的不同记录的几个心跳，并发现了等效的结果。作为初始估计，我们报告了从前五个记录中随机选择的三个心跳获得的平均熵，并且重新开始测试基于该平均熵。在小节中讨论的建议的优化技术2.1 通过使随机变量的分布更加均匀，在提高熵方面起到了至关重要的作用。为了观察优化过程对由伯努利过程产生的比特分布的影响，我们已经计算了在优化之前和之后从三个不同心跳生成的RBS中的00s和10s的分布，如图5所示。可以注意到，由于优化，平均分布变得几乎均匀（50.56%的0该方法的高吞吐量使其具有实际应用前景。我们将吞吐量提高了Md Saiful Islam沙特国王大学学报表51525152重新启动测试并更新PTB数据库的估计值。i测试量化级别名称4位6位8位1健全性检查（a= 0.0000104）P（X≥X最大值）= 0.053 P（X≥X最大值）= 0.0201 P（X≥X最大值）= 0.03602确认测试Hr =0.9472Hr = 0.9503Hr = 0.9379Hc= 0.9472Hc = 0.9503Hc = 0.9379评估通过更新后的熵估计（H）0.8728 0.8857 0.8399表6FECG数据库的排列测试i测试量化级别名称4位6位8位Ci，0Ci，1Ci，0Ci，1Ci，0Ci，11偏移检验统计量2633019220160302定向天线554022893684123定向天线的长度03043483391291465834增加和减少6497394471378666195基于中位数的平均数46812557999416基于中位数的长度83927459322323241523237平均碰撞测试统计4474910862649308最大碰撞测试统计10327652257104894881419周期性检验统计量（log = 1）86941735912948623410周期性检验统计量（log = 2）9307776092258412511周期性检验统计量（log = 8）63632634502740512912周期性检验统计量（log = 16）80681323572363853313周期性检验统计量（log = 32）74572081112386131514协方差检验统计量（log = 1）36575921447197315协方差检验统计量（log = 2）7066598030299016协方差检验统计量（log = 8）6612272972309417协方差检验统计量（log = 16）29904124933897718协方差检验统计量（log = 32）66655894917562319压缩试验统计934415370182627461排列测试评估通过通过通过表7FECG数据库的卡方统计检验i测试量化级别名称4位6位8位检验统计量临界值检验统计量临界值检验统计量临界值（T）（Cv）（T）（Cv）（T）（

下载后可阅读完整内容，剩余1页未读，立即下载