半岛体育- 半岛体育官方网站- APP下载一种基于深度感知哈希的密文语音检索方法及系统

2025-09-27

  半岛,半岛体育,半岛体育app,半岛官网,半岛电竞,半岛真人,半岛棋牌,半岛体育官网注册,半岛体育官方app下载,半岛体育app下载,半岛体育怎么样,半岛体育官网,半岛体育登录入口,半岛体育官方网站

半岛体育- 半岛体育官方网站- 半岛体育APP下载一种基于深度感知哈希的密文语音检索方法及系统

  根据所述原始语音库,构造原始语音文件的深度感知哈希序列,并生成系统哈希索引

  库提取音频特征,采样率为16kHz,帧长、帧移分别设为25ms、10ms,采用汉明窗函数,并将输

  将提取的特征输入到训练好的CNN‑BiLSTM网络模型中,提取深度感知特征序列H={H

  将提取的深度感知特征序列H={H(i)i=1,2,…,M}进行哈希构造,生成深度感知哈

  希序列h={h(i)i=1,2,…,M},其中二进制深度感知哈希序列的长度M=384;二进制深度

  步骤4:系统哈希索引表的生成;按照上述3个步骤,得到全部原始语音(S1,S2,…,Sx)

  的深度感知哈希序列(h1,h2,…,hx),并且每条语音生成的深度感知哈希序列与其相对应

  的密文语音构成Key‑Value的一一映射关系,并上传到云端的系统哈希索引表中;

  根据所述待查询语音的深度感知哈希序列利用归一化汉明距离算法在所述系统哈希

  2.根据权利要求1所述的基于深度感知哈希的密文语音检索方法,其特征在于,所述构

  3.根据权利要求1所述的基于深度感知哈希的密文语音检索方法,其特征在于,所述根

  据所述待查询语音的深度感知哈希序列利用归一化汉明距离算法在所述系统哈希索引表

  密文语音库构建模块,用于根据原始语音库,对原始语音文件进行加密处理来构建密

  系统哈希索引表生成模块,用于根据所述原始语音库,构造原始语音文件的深度感知

  库提取音频特征,采样率为16kHz,帧长、帧移分别设为25ms、10ms,采用汉明窗函数,并将输

  将提取的特征输入到训练好的CNN‑BiLSTM网络模型中,提取深度感知特征序列H={H

  将提取的深度感知特征序列H={H(i)i=1,2,…,M}进行哈希构造,生成深度感知哈

  希序列h={h(i)i=1,2,…,M},其中二进制深度感知哈希序列的长度M=384;二进制深度

  步骤4:系统哈希索引表的生成;按照上述3个步骤,得到全部原始语音(S1,S2,…,Sx)

  的深度感知哈希序列(h1,h2,…,hx),并且每条语音生成的深度感知哈希序列与其相对应

  的密文语音构成Key‑Value的一一映射关系,并上传到云端的系统哈希索引表中;

  检索匹配模块,用于根据所述待查询语音的深度感知哈希序列利用归一化汉明距离算

  5.根据权利要求4所述的基于深度感知哈希的密文语音检索系统,其特征在于,所述密

  6.根据权利要求4所述的基于深度感知哈希的密文语音检索系统,其特征在于,所述检

  距离确定单元,用于根据所述待查询语音的深度感知哈希序列利用归一化汉明距离算

  检索匹配成功单元,用于在所述距离小于相似性阈值时,输出检索匹配成功,将匹配成

  检索匹配失败单元,用于在所述距离大于或等于相似性阈值时,输出检索匹配失败。

  端的多媒体数据为用户节省了本地空间,方便了不同客户端之间的数据共享的同时,也带

  来了查找困难、隐私泄露和数据不安全的问题。由于语音中包含大量机密信息,这使得语音

  信息在上传云端之前进行加密成为必然。由于语音数据加密后语音特征的巨大变化以及语

  音数据的不断增长,给密文语音检索增加了困难。因此,对密文语音检索技术的研究获得了

  感知特征来实现。现有的语音特征提取方法在提取特征数量多时,效率明显降低,且受限于

  鲁棒性和区分性、摘要性和检索效率的矛盾,并且基于感知哈希的密文语音检索方法,不能

  满足对海量语音数据的检索需求,且索引的复杂度会随着数据维数的增加而呈指数级增

  长,从而导致维度灾难问题。而语音特征提取是检索过程的基础,特征表达的性能直接影响

  到后续的检索效果。由于现有基于感知哈希的密文语音检索方法都是利用已经设计好的语

  音特征,对提取的特征进行哈希构造进而生成二进制哈希序列来实现语音检索,而再重新

  设计适合密文语音检索的语音特征时需要大量的先验知识和实验过程。另外,现有的基于

  感知哈希的密文语音检索方法采用的语音长度均为4s‑6s之间,增加语音长度后检索精度

  和检索效率均有所下降,因此本发明拟利用深度学习的方法来实现对较长的长语音(10s)

  为深入的网络结构。由于CNN泛化能力强,对于局部数据的挖掘能力特别强,在人工智能领

  Neural  Network  Model)不同于CNN,可以对时序数据进行处理,实现对时间序列上的变化

  是在LSTM神经网络基础上进行改进而形成的一种新的模型,可以解决由于传输时长增加导

  致的信息遗失程度明显的问题。受深度学习技术的启发,深度哈希方法将深度网络的输出

  作为特征更加适合描述语义信息。同时,深度学习方法也被应用于音频领域以从音频中捕

  中不可缺少的技术。现有的密文语音检索方法使用的加密算法例如DES、AES、低维混沌等已

  不适用于多媒体数据的加密,而超混沌系统凭借对初始参数的敏感性、随机性和遍历性等

  目前,卷积神经网络(CNN)只能提取局部特征,不能很好的对时序数据进行处理。

  长短期记忆神经网络(LSTM)虽然可以对时序数据进行建模,但当传输时长增加时会使信息

  遗失程度变得明显。BiLSTM对每一个输入序列正向和反向都经过一次LSTM网络,但计算量

  可选地,所述根据原始语音库,对原始语音文件进行加密处理来构建密文语音库,

  可选地,所述根据所述原始语音库,构造原始语音文件的深度感知哈希序列,并生

  从所述训练好的CNN‑BiLSTM模型中提取语音的深度特征,生成语音的深度感知哈

  深度感知哈希序列生成单元,用于从所述训练好的CNN‑BiLSTM模型中提取语音的

  文件与系统哈希索引表中的深度感知哈希序列建立一一映射关系,完成系统哈希索引表的

  检索匹配成功单元,用于在所述距离小于相似性阈值时,输出检索匹配成功,将匹

  学习方法在各个领域取的优越性,学习语音的紧凑二进制码来构造深度感知哈希序列以实

  需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施

  例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图

  整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于

  本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他

  图1为本发明基于深度感知哈希的密文语音检索方法流程图。如图1所示,一种基

  步骤101:根据原始语音库,对原始语音文件进行加密处理来构建密文语音库,具

  混沌系统因为具有对初始条件和控制参数的高度敏感性、遍历性、确定性、伪随机

  性、非周期性等优点,在多媒体加密领域有着广泛的应用。具有二次非线D超混沌系统

  是从经典的Lorenz系统推导出一种新的具有两个二次非线项四维超混沌系统。其

  )作为系统密钥可以生成用于加密的四维超混沌序列X={x(i) ,1≤i≤N},Y={y(i) ,1

  步骤1:语音信号预处理。读取语音信号S={s(i) ,1≤i≤L},其中L=160,000。

  步骤2:置乱操作。对所有语音采样点S={s(i) ,1≤i≤L}的位置使用4D超混沌系

  统生成的第一维混沌序列X={x(i) ,1≤i≤L}和第二维混沌序列Y={y(i) ,1≤i≤L}进行

  置乱操作。首先对混沌序列X和Y分别通过式(2)和式(3)得到X和Y′,然后将X′和Y′通过式

  (i),1≤i≤L}和第四维混沌序列W={w(i),1≤i≤L}对置乱后的一维语音S

  步骤102:根据所述原始语音库,构造原始语音文件的深度感知哈希序列,并生成

  从所述训练好的CNN‑BiLSTM模型中提取语音的深度特征,生成语音的深度感知哈

  本发明利用深度学习具有自主特征提取的特点,将CNN和BiLSTM相融合来学习语

  音的深度感知特征。图4为本发明采用的CNN+BiLSTM网络学习框架。表1是CNN‑BiLSTM网络

  从表1可知该模型的主要构成和参数设置。其中TimeDistributed可以使用时间序

  列来进行一系列张量操作,方便实现CNN与BiLSTM连接。同时,为提高网络拟合速度减少训

  取的空间特征进行最大池化。Flatten层是为了将数据变成一维数据以便输入到下一层。最

  后第一个全连接层Dense作为特征提取层,然后利用Softmax作为网络输出层Dense的激活

  图4所示的网络模型采用Python的Keras库实现,用于训练的损失函数是binary

  并使用relu激活函数来提供范围约束,全连接层的神经元个数即为目标二进制深度感知哈

  希码的码长。通过网络模型的训练,可以将语义信息嵌入到这个全连接层输出之中。利用训

  练好的网络将原始的高维特征空间映射至低明空间中,形成紧凑的二进制深度感知哈

地址:半岛体育永久网址【363050.com】 客服热线:363050.com 传真:363050.com QQ:363050.com

Copyright © 2012-2025 半岛体育网站 版权所有 非商用版本