一种基于哈希算法的社交网半岛体育- 半岛体育官方网站- APP下载络关系预测方法
2025-09-29半岛,半岛体育,半岛体育app,半岛官网,半岛电竞,半岛真人,半岛棋牌,半岛体育官网注册,半岛体育官方app下载,半岛体育app下载,半岛体育怎么样,半岛体育官网,半岛体育登录入口,半岛体育官方网站
S1.构建社交网络对应的图结构,对图结构中各个顶点的原始向量表达,采用MinHash
S2.对图结构中每个顶点的原始向量表达以及该顶点的所有邻居顶点的初始向量表达
的并集,分别使用MinHash算法再生成两个中间向量表达,同时保存这两个中间向量表达中
S3.比较每个顶点对应的两个中间向量表达中每一维度的哈希值,将最小值对应的哈
S4.根据每个顶点的当前向量表达,计算任意两个顶点之间的相似度,从而构建相似度
S5.针对待判断的边,先从相似度矩阵中获取该边对应的两个顶点之间的相似度,然后
从相似度矩阵中随机抽样若干个不存在边的顶点对之间的相似度,如果前面相似度大于后
2.根据权利要求1所述的基于哈希算法的社交网络关系预测方法,其特征在于,所述步
骤S1中,采用MinHash算法计算图结构中各个顶点的初始向量表达,具体包括以下步骤:
S1‑1.对于图结构中的每个顶点,在初始阶段表示为A维特征向量x,特征向量x的每
S1‑2.采用以下算式,将特征向量x转换为K维哈希码,从而得到该顶点的向量表达:
3.根据权利要求1所述的基于哈希算法的社交网络关系预测方法,其特征在于,所述步
S4‑1.根据每个顶点的K维当前向量表达,计算任意两个顶点之间的海明相似度;
式中,Sim(i,j)为相似度矩阵的第i行第j列的元素,表示顶点i与顶点j的相似度;x
4.根据权利要求1所述的基于哈希算法的社交网络关系预测方法,其特征在于,所述步
骤S5中,针对待判断的边,从相似度矩阵中一万次随机抽样不存在边的顶点对。
5.根据权利要求1所述的基于哈希算法的社交网络关系预测方法,其特征在于,所述步
图数据在现实生活中非常普遍,如蛋白质交互图、社交网络、引文网络等。随着大
数据时代的到来,图数据的种类和数量均呈现指数式增长,也推动了图挖掘技术的高速发
展。图挖掘领域的一个重要应用是链接预测,判断图中任意两个顶点之间是否存在边。链接
预测技术也推动了数据挖掘技术在社交领域的发展,有利于快速判断两个用户之间是否存
在交互关系,这种交互关系意味着这两个用户之间存在很高的相似性,进而可向邻居用户
根据图中顶点是否携带信息,图数据通常分为两类:普通图和属性图。前者仅包含
图的结构信息,而后者同时包含结构和顶点的内容信息,例如,社交网络中代表用户的顶点
携带用户个人信息,蛋白质交互网络中代表蛋白质的顶点携带蛋白质相关性质信息。因此
类传统方法,图嵌入方法旨在将图中每个顶点映射到低维空间中,通过计算低维空间中的
距离来近似原始图中顶点的相似度,进而判断顶点之间是否存在边。图神经网络技术能够
学习图中的隐藏模式;近些年的研究表明图神经网络技术具有强大的图表达能力,能够有
效保存图中的结构和顶点的内容信息。但是,图神经网络技术由于海量的参数计算,极其依
S2.对图结构中每个顶点的原始向量表达以及该顶点的所有邻居顶点的初始向量
表达的并集,分别使用MinHash算法生成两个中间向量表达,同时保存这两个中间向量表达
S3.比较每个顶点对应的两个中间向量表达中每一维度的哈希值,将最小值对应
S4.根据每个顶点的当前向量表达,计算任意两个顶点之间的相似度,从而构建相
S5.针对待判断的边,先从相似度矩阵中获取该边对应的两个顶点之间的相似度,
然后从相似度矩阵中随机抽样若干个不存在边的顶点对之间的相似度,如果前面相似度大
进一步的,所述步骤S1中,采用MinHash算法计算图结构中各个顶点的初始向量表
S1‑1 .对于图结构中的每个顶点,在初始阶段表示为A维特征向量x,特征向量x
S1‑2 .采用以下算式,将特征向量x转换为K维哈希码,从而得到该顶点的向量表
S4‑1.根据每个顶点的K维当前向量表达,计算任意两个顶点之间的海明相似度;
式中,Sim(i,j)为相似度矩阵的第i行第j列的元素,表示顶点i与顶点j的相似度;
进一步的,所述步骤S5中,针对待判断的边,从相似度矩阵中一万次随机抽样不存
MinHash函数来高效表达图中所有顶点,取得了关于顶点数量的线性时间和空间复杂度,并
有效保存了顶点之间的相似度信息,能够生成用于链接预测的相似度矩阵,从而完成用户
之间关系的预测;本发明方法避免了图神经网络中海量的参数学习,同时不再依赖昂贵的
高端硬件,能够在满足社交网络关系预测精度的前提下,明显降低时间开销,尤其适用于大
规模社交网络数据集场景下的关系预测任务,而且可靠性高,精确性好,效率较高。
明。本领域技术人员应该明了,所述实施例仅仅是帮助理解本发明,不应视为对本发明的具
社交网络通常都可以建模为一个图g=(V,E,A,f),其中V为该图的顶点集,E为该
图的边集,A为该图的属性集,图中每个顶点携带多个数值型属性,f: 将顶点表
如图1、2所示,本发明提供了一种基于哈希算法的社交网络关系预测方法,包括如
S1 .构建社交网络对应的图结构,对图结构中各个顶点的原始向量表达,采用
假设整个社交网络中所有顶点包含的特征个数为A,初始化MinHash算法的参
数:生成服从均匀分布的K组随机数a,b,c;其中c为大于特征个数A的质数;
S2.对图结构中每个顶点的原始向量表达以及该顶点的所有邻居顶点的初始向量
表达的并集,分别使用MinHash算法生成两个中间向量表达,同时保存这两个中间向量表达
S3.比较每个顶点对应的两个中间向量表达中每一维度的哈希值,将最小值对应
的哈希码作为该顶点在该维度的哈希码,即得到每个顶点的当前向量表达;如图3所示。
图3中,顶点1、2和3的原始向量表达为[α,β,γ]、[γ,β,∈]和[ζ,β,φ]。在
下,顶点1的邻居顶点2和3的初始向量表达分别为[β,γ,∈]和[β,ζ,ζ],取并后为
{β,γ,∈,β,ζ,ζ}。分别采用 和 对顶点1和它的邻居顶点计算中间向量
表达,通过比较每一维度的哈希值,最后取最小值对应的哈希码生成顶点1的当前向量表达
S4.根据每个顶点的当前向量表达,计算任意两个顶点之间的相似度,从而构建相
S4‑1.根据每个顶点的K维当前向量表达,计算任意两个顶点之间的海明相似度;
式中,Sim(i,j)为相似度矩阵的第i行第j列的元素,表示顶点i与顶点j的相似度;
S5.针对待判断的边,先从相似度矩阵中获取该边对应的两个顶点之间的相似度,
然后从相似度矩阵中随机抽样若干个不存在边的顶点对(不包含待判断的边)之间的相似
度,如果前面相似度大于后面相似度的比例超过设定阈值,则认为该边存在,否则认为该边
具体的,在步骤S4中,针对待判断的边,在社交网络中多次(比如10000次)随机抽
顶点内容的网络链接预测。预测结果为社交网络中的两个用户是否存在关系,比如通过微
信朋友圈判断两个没有互加好友的用户是否有潜在的好友关系或者相同的兴趣爱好等,进
理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换