图（graph）中的随机游走（random walk）到底怎么应用，其具体原理是什么？

如题所述

推荐答案 2024-04-08

探索图中的随机游走：原理与应用

在机器学习的大世界中，图与数据的融合是一种关键的步骤，这就是图嵌入的魔术。面对海量节点的社交网络，如何将这些节点嵌入到向量空间以避免维度灾难，这就需要DeepWalk这位神奇的助手登场。它源于Google的创新算法Word2Vec，后者曾以单词向量的生成而闻名。

Word2Vec以前，词向量通常是通过独热编码实现的，每个词对应一个全零向量，只有特定位置为1，但这种编码方法效率低且缺乏语义联系。Word2Vec的突破在于将单词映射到一个向量空间，让相似的词在空间中紧密相连，如"国王-男人+女人≈女王"，这就是通过skip-gram模型训练，预测上下文单词来捕捉词的语义特征。

接着，DeepWalk在2014年带来了图嵌入的新视角。Bryan Perozzi巧妙地将Word2Vec的思想应用于图，通过随机游走模拟节点的"醉汉漫步"。随机游走生成的节点序列，就像一个自然的语言句子，被输入Word2Vec模型，以此学习节点的上下文特征，从而得到每个节点的嵌入向量，应用于各种下游任务，如链接预测和节点分类。

Node2Vec是对DeepWalk的进一步优化，它引入了有偏二阶随机游走，允许节点在游走过程中更灵活地选择路径。通过调整参数p和q，Node2Vec在保持局部信息的同时，探索更深层次的结构。然而，随机游走方法的局限在于无法适应新节点的加入，且对地理位置信息的依赖可能限制了全局特征的捕捉。

为了克服这些问题，全图嵌入的方法尝试整合所有节点的信息，通过虚拟节点或匿名随机游走来捕捉图的全局特性。匿名随机游走不仅考虑了节点间的连接，还引入了图元核方法，通过概率统计序列出现的频率，构建图的特征向量。而自监督学习则通过预测随机游走序列，让神经网络学习到图的内在结构特征。

总的来说，随机游走在图嵌入中的应用，不仅展示了数据结构与机器学习的巧妙结合，更展示了在处理大规模复杂网络时的创新思维。每一步优化都在挑战传统的理解，推动着我们更深入地挖掘图数据的潜在价值。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/OOeeWzvvXteWW7eOjv.html

相似回答

重启随机游走算法Random Walk with Restart (RWR)答：最基本的随机游走：给定一个连接图，以及图中每个节点的转移概率，目的就是找到从某个起点开始随机走动，最终停在每个点的概率。重启随机游走的区别就是在每次游走之后有一定概率回到起点。先看一下公式：的大小在0,1之间，为转移概率矩阵，是从节点到节点的概率。是起点向量，i为起点则 ...

Graph Embedding之node2vec答：论文作者提出了一种能在BFS和DFS中实现平滑过渡的随机游走方法，称之为node2vec，在Random Walks的基础上，为每一步Walk引入了偏执，下图展示了node2vec的有偏随机游走的过程。如上图所示，作者定义了一个二阶游走的过程：假设目前已经从顶点游走到了顶点，此...

几种常见的Graph Embedding方法答：（1）随机游走随机均匀地选取网络节点，并生成固定长度的随机游走序列，将此序列类比为自然语言中的句子（节点序列=句子，序列中的节点=句子中的单词），应用skip-gram模型学习节点的分布式表示。（2）前提：如果一个网络的节点服从幂律分布，那么节点在随机游走序列中的出现次数也服从幂律分布，并且实...

股票相反理论,相反理论,什么是相反理论答：根据图表就可以预知未来股价走势.随机漫步理论---反技术图表派的基础随机漫步理论(Random Walk)也称随机游走,随机漫步理论却反对这种说法,易受个人主观意识影响。 ---第一种方法,凡是裂口上升或下跌。金字塔的长度为5813寸(5-8-13),但在整个长期的趋势上,股市尾声到期来。从事技术分析时。假设线路已向上突破抵抗...

随机漫步理论(Random Walk Theory)是谁提出的?答：奥斯本 1959年提出

什么是温度计?答：工作原理根据使用目的的不同,已设计制造出多种温度计。其设计的依据有:利用固体、液体、气体受温度的影响而热胀冷缩的现象;在定容条件下,气体(或蒸汽)的压强因不同温度而变化;热电效应的作用;电阻随温度的变化而变化;热辐射的影响等。一般说来,一切物质的任一物理属性,只要它随温度的改变而发生单调的、显著的...

什么是数据区块链(BlockChain)?答：区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链（Blockchain），是比特币的一个重要概念，它本质上是一个去中心化的数据库，同时作为比特币的底层技术，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次比特币网络交易的信息，用于验证其...

股票走势图中MA(5,10,20,60)是什么东西?各数字代表什么意思?答：MACD指标是基于均线的构造原理,对价格收盘价进行平滑处理(求出算术平均值)后的一种趋向类指标。它主要由两部分组成,即正负差(DIF)、异同平均数(DEA),其中,正负差是核心,DEA是辅助。DIF是快速平滑移动平均线(EMA1)和慢速平滑移动平均线(EMA2)的差。在现有的技术分析软体中,MACD常用引数是快速平滑移动平均线为...

到底什么是金融?视频时间 01:39

大家正在搜

random python怎么用金融中的randomwalk random是什么意思 random怎么用 random walks random order randomwalk random.sample random house