-
Notifications
You must be signed in to change notification settings - Fork 43
/
Copy path6DegreeCorrelations.Rmd
324 lines (215 loc) · 26.6 KB
/
6DegreeCorrelations.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
---
title: "6 Degree Correlations"
author: "戴昶妍2020213053025"
date: "2021/10/10"
output: word_document
---
# 一.简介
在社交网络中,枢纽倾向于彼此“约会”,而在蛋白质相互作用网络中,情况恰恰相反:枢纽避免与其他枢纽连接,而是与许多小程度的节点连接。虽然从两个例子中推导出一般原则是危险的,但这些模式是真实网络的一般属性的表现:它们表现出一种称为度相关性的现象。接下来讨论如何测量度相关性,并探讨它们对网络拓扑的影响。
# 二.同配性和异配性
仅仅凭借它们拥有的众多链接,集线器就有望相互链接。在一些网络中,它们会,在另一些则不会。如图7.3所示,它展示了三种程度序列相同但拓扑结构不同的网络:
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure1.jpg)
## 神经网络
图7.3b显示了一个随机布线的网络。我们称这种网络为中立的,这意味着枢纽之间的链接数量与我们的预期是一致的。
## 同配型网络
图7.3a的网络与图7.3b的网络的度序完全相同。然而,图7.3a中的集线器倾向于相互链接,避免链接到小程度的节点。同时,小度节点倾向于与其他小度节点相连。呈现这种趋势的网络是协调性的。这种模式的一种极端表现形式是完全协调性网络,其中每个degree-k节点只与其他degree-k节点相连(图7.4)。
## 异配型网络
在图7.3c中,集线器相互避免,而是链接到小程度的节点。因此,网络显示一个中心和辐条字符,使它不协调。
一般来说,如果高度节点和低度节点之间的链接数量与随机预期的有系统差异,网络就会显示程度相关性。换句话说,k度节点与k '节点之间的链接数偏离
$$ \\p_{k,k'}=\frac{kk'}{2L}$$(1)。
通过度相关矩阵eij,即在随机选择的链路两端找到i度和j度节点的概率,来获取潜在度相关的信息。由于eij是一个概率,它是标准化的,即
$$\sum_{i,j}e_{ij}=1$$(2)
我们已经推导出随机选择的链路末端有k度节点的概率qk,得到
$$q_k=\frac{kp_k}{<k>}$$(3)
我们可以将qk连接到eij
$$\sum_j e_{ij}=q_k$$(4)
在神经网络中,我们期望
$$e_{ij}=q_iq_j$$(5)
如果eij偏离随机期望(5),则网络显示度相关性。注意(2)-(5)对具有任意度分布的网络是有效的,因此它们适用于随机和无标度网络。
鉴于eij编码了所有关于潜在度相关性的信息,我们从它的视觉检查开始。图7.3d,e,f显示了选型网络、中立网络和非选型网络的eij。在一个神经网络中,小而高度的节点之间是随机连接的,因此eij没有任何趋势(图7.3e)。与之相反,选型网络沿主对角线表现出较高的相关性,表明节点主要与具有可比性的节点相连。因此,低度节点倾向于连接其他低度节点(图7.3d)。在非协调性网络中,eij表现出相反的趋势:它沿次对角线具有较高的相关性。因此,高度节点倾向于连接到低度节点(图7.3f。
总的来说,度相关的信息由度相关矩阵eij携带。然而,通过检验eij来研究度相关性有很多缺点:
## 1.很难从矩阵的视觉检查中提取信息。
## 2.无法推断相关性的大小,很难比较具有不同相关性的网络。
## 3.ejk包含大约k^2max/2个独立变量,代表了在分析计算和模拟中难以建模的大量信息。
因此,我们需要开发一种更紧凑的方法来检测度相关性。这是我们的目标。
# 三.测量度相关性
虽然eij包含了描述一个特定网络的度相关性的完整信息,但是很难解释它的内容。本节将介绍度相关函数,它提供了量化度相关性的一种更简单的方法。
度相关性捕获了相互连接的节点度之间的关系。量化它们大小的一种方法是测量每个节点i的邻居的平均度(图7.5)
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure2.jpg)
$$k_{nn}(k_i)=\frac{1}{k_i}\sum_{j=1}^N A_{ij}k_j$$(6)
度相关函数计算所有k度节点的(6)
$$k_{nn}(k)=\sum_{k'} k'P(k'|k)$$(7)
其中,P(k '|k)是沿着k度节点的链接到达k度节点的条件概率。因此knn(k)是所有k度节点的邻居平均度。为了量化度相关性,我们考察了knn(k)对k的依赖关系。
## 神经网络
对于一个神经网络(3)-(5)预测
$$P(k'|k)=\frac{e_{kk'}}{\sum_{k'} e_{kk'}}=\frac{e_{kk'}}{q_k}=\frac{q_k'q_k}{q_k}=q_k$$(8)
这允许我们把knn(k)表示为
$$k_{nn}(k)=\sum_{k'} k'q_{k'}=\sum_{k'} k'\frac{k'p(k')}{<k>}=\frac{k^2}{<k>}$$(9)
因此,在一个中立网络中,节点邻居的平均度独立于节点的度k,并且只依赖于全局网络特征⟨k⟩和⟨k2⟩。因此,在k的函数中绘制knn(k)应导致在⟨k2⟩/⟨k⟩上的一条水平线,正如电网中观察到的(图7.6b)。方程(9)还捕捉到了真实网络的一个有趣特性:我们的朋友比我们更受欢迎,这一现象被称为友谊悖论。
## 同配型网络
在同配络中,集线器倾向于连接到其他集线器,因此,节点的k度越高,其最近邻的平均度就越高。因此,对于同配性网络,knn(k)随着k的增加而增加,正如在科学合作网络中观察到的那样(图7.6a)。
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure3.jpg)
## 异配型网络
在异配型网络中,集线器更喜欢连接到低程度的节点。因此,正如代谢网络所观察到的那样,knn(k)随k减少(图7.6c)。
图7.6中观察到的行为提示我们用近似度相关函数
$$k_{nn}(k)=ak^μ$$(10)
如果缩放(10)成立,则度相关性的性质由相关指数μ的符号决定:
## 同配型网络:$$μ > 0$$
与knn(k)相匹配的科学合作网络为$$μ = 0.37±0.11$$(图7.6a)。
## 中性网络:$$μ = 0$$
根据(9)knn(k)是独立于k的。确实,对于电网,我们得到$$μ=0.04±0.05$$,与零无区别(图7.6b)。
## 异配型网络:$$μ < 0$$
对于代谢网络,我们得到$$μ =−0.76±0.04$$(图7.6c)。
总之,度相关函数帮助我们捕捉真实网络中是否存在相关性。knn(k)函数在分析计算中也起着重要的作用,它允许我们预测度相关性对各种网络特征的影响。然而,使用单个数字来捕捉网络中存在的相关性的大小通常是很方便的。这可以通过(10)中定义的相关指数μ,或使用引入的度相关系数来实现。
# 四.真实网络中的相关性
为了理解度相关性的普遍性,我们需要检查描述真实网络的相关性。在图7.10中,我们给出了10个参考网络的knn(k)函数,观察到几种模式:
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure4.jpg)
## 电网
对于电网来说,knn(k)是扁平的,与它的随机版本难以区分,表明缺乏度相关性(图7.10a)。因此电网是中性的。
## 互联网
对于小度($$k≤30$$),knn(k)显示出明显的协调性趋势,对高度的影响趋于平稳(图7.10b)。度相关性在随机版的互联网地图中消失了。因此,互联网是协调性的,但结构截断消除了高k的影响。
## 社交网络
三个捕捉社会互动的网络,手机网络,科学合作网络和行动者网络,都有一个递增的knn(k),表明它们是协调性的(图7.10c-e)。因此,在这些网络中,枢纽倾向于连接到其他枢纽,低度节点倾向于连接到低度节点。所观察到的knn(k)与knn(k)不同的事实表明,社会网络的协调性并不是由于它们的无标度分布。
## 电子邮件网络
虽然电子邮件网络通常被视为一个社交网络,但它的knn(k)随着k的增加而减少,记录了一个清晰的不协调性行为(图7.10f)。随机化的knn(k)也会衰减,这表明我们正在观察结构的不协调性,这是网络无标度性质的结果。
## 生物网络
蛋白质相互作用和代谢网络都具有负的μ,表明这些网络是不协调性的。然而,knn(k)的尺度与knn (k)是不可区分的,这表明我们正在观察结构性的不协调性,根源于这些网络的无尺度性质(图7.10 g,h)。
## WWW
衰减的knn(k)意味着非协调性相关性(图7.10i)。随机化的knn(k)也衰减,但没有knn(k)那么快。因此万维网的非协调性并不能完全用它的度分布来解释。
## 引文网络
该网络表现出令人困惑的行为:当$$k≤20$$时,度相关函数knn(k)表现出明显的协调性趋势;然而,对于$$k > 20$$,我们观察到非协调性缩放(图7.10j)。这种混合行为可能出现在显示极端协调性的网络中(图7.13b)。这表明引文网络具有很强的协调性,但其无标度的性质导致了结构的不协调性,从而改变了knn(k)的斜率。
综上所述,图7.10表明,要理解度相关性,我们必须始终将knn(k)与随机化的knn(k)进行比较,这也让我们得出一些有趣的结论:
## 在10个参考网络中,电网是唯一真正中立的网络。因此,大多数真实的网络显示出度相关性。
## 所有显示非协调性倾向的网络(电子邮件、蛋白质、代谢)都是由于其无标度特性。因此,这些都是结构上的不协调性。只有WWW显示了非协调性相关性,这种相关性只能部分地用它的度分布来解释。
## 分类网络的度相关性不能用它们的度分布来解释。大多数社交网络(手机呼叫、科学合作、演员网络)都属于这门课,互联网和引文网络也是如此。
有人提出了一些机制来解释所观察到的协调性的起源。例如,个体形成社区的倾向,可以诱发协调性相关性。同样,社会也有无数的机制,从专业委员会到电视节目,将各中心聚集在一起,增强社会和专业网络的协调性。最后,度同质性是一个被充分记录的社会现象,它表明个体倾向于与其他具有相似背景和特征的个体联系在一起,因此具有可比性程度的个体倾向于相互了解。这种程度上的同质性也可能是名人婚姻的原因。
# 五.生成相关的网络
为了探究度相关性对各种网络特征的影响,我们必须首先理解描述目前所讨论的网络模型的相关性。开发能够生成具有可调相关性的网络的算法也同样重要。正如我们在本节中所展示的,考虑到无标度属性和度相关性之间的冲突,这不是一项简单的任务。
## 静态模型的度相关性
### Erdős-Renyi模型
根据定义,随机网络模型是中性的。由于缺乏中心,它也没有形成结构性相关性。因此,对于Erdős-Rényi网络,knn(k)由(9)给出,预测任何⟨k⟩和N的$$μ = 0$$。
### 配置模型
配置模型也是中立的,独立于度分布pk的选择。这是因为该模型既允许多环节,也允许自循环。因此,由集线器引起的任何冲突都可以通过集线器之间的多个链接来解决。然而,如果我们迫使网络变得简单,那么生成的网络将会产生结构不协调。
### 隐藏的参数模型
在模型中,ejk与随机选择的隐藏变量ηj和ηk的乘积成正比。因此,网络在技术上是不相关的。然而,如果我们不允许多链路,对于无标度网络,我们又会观察到结构的不协调性。分析计算表明,在这种情况下,
$$k_{nn}(k)~k^{-1}$$(11)
即度相关函数为(10),$$μ =−1$$。
综上所述,到目前为止所探索的静态模型要么生成神经网络,要么生成具有结构不协调性的网络。
## 演化网络中的度相关性
为了理解成长网络中度相关性的出现(或缺失),我们从初始吸引力模型开始,其中包括了Barabási-Albert模型的一个特例。
### 最初的吸引力模型
考虑一个不断增长的网络,其中优先依恋紧随其后,即$$Π(k)∼a+k$$,其中a是初始吸引力。根据A的值,我们观察到三种不同的缩放机制:
#### 同配状态:$$γ < 3$$
如果$$−m < A < 0$$
$$k_{nn}(k)~m\frac{(m+A)^{1-\frac{A}{m}}}{2m+A}S(\frac{2m}{2m+A})N^{-\frac{A}{2m+A}\frac{A}{k^m}}$$(12)
因此得到的网络是不协调性的,knn(k)按照幂律衰减
$$k_{nn}(k)~k^{-\frac{|A|}{m}}$$(13)
#### 中性状态:$$γ = 3$$
当A = 0时,初始吸引力模型简化为Barabási-Albert模型。在这种情况下
$$k_{nn}(k)~\frac{m}{2}lnN$$(14)
因此,knn(k)与k无关,因此网络是中立的。
#### 弱配性:$$γ >3$$
如果A>0计算预测
$$k_{nn}(k)\approx(m+A)ln(\frac{k}{m+A})$$(15)
当knn(k)随k对数增加时,得到的网络呈现弱协调性趋势,但不符合(10)。
综上所述,(12)-(15)表明初始吸引力模型产生了相当复杂的程度相关性,从非协调性到弱协调性。(14)式也表明Barabási-Albert模型生成的网络是中性的。最后,(12)预测了knn(k)的幂律k依赖性,为经验标度(10)提供了分析支持。
### Bianconi-Barabasi模型
在适应度分布一致的情况下,Bianconi-Barabási模型生成一个非协调性网络(图7.12)。网络的随机化版本也是非协调性的事实表明模型的非协调性是结构性的。然而,需要注意的是,实knn(k)和随机knnR-S(k)不重叠,这表明模型的不协调性不能完全用其无标度的性质来解释。
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure5.jpg)
## 优化度相关性
有几种算法可以生成具有所需度相关性的网络。接下来我们讨论Xalvi-Brunet和Sokolov提出的算法的简化版本,该算法旨在生成具有预定义程度序列的最大关联网络。它包括以下步骤(图7.13a):
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure6.jpg)
### 步骤1:链接选择
随机选择两个链接。将这两个链路末端的四个节点分别标记为a、b、c、d,其度排序为$$ka≥kb≥kc≥kd$$。
### 步骤2:重新布线
断开选定的链接并重新连接它们以形成新的对。根据所需的相关性程度,重新布线有两种方式:
#### 步骤2A:协调性
通过对两个最高度的节点(a与b)和两个最低度的节点(c与d)进行配对,我们将具有可比度的节点连接起来,增强了网络的协调性。
#### 步骤2B:不协调性
通过对最高和最低度的节点(a和d,b和c)进行配对,我们将不同程度的节点连接起来,增强了网络的非协调性。
通过迭代这些步骤,我们逐渐增强了网络的协调性(步骤2A)或非协调性(步骤2B)特征。如果我们的目标是生成一个简单的网络(没有多链路),在步骤2之后,我们检查特定的重新布线是否导致多链路。如果是,我们拒绝它,回到步骤1。
由该算法生成的网络的相关特征收敛到给定程度序列所能达到的最大值(选型)或最小值(非选型)(图7.13b)。该模型在创建非协调性相关性方面没有困难(图7.13e,f)。
在选型限制中,简单网络显示一个混合的knn(k):小k的选型,高k的不选型(图7.13b)。这是结构截断的结果:对于无标度网络,系统无法维持高k的协调性。观察到的行为让人想起引文网络的knn(k)函数(图7.10j)。
图7.13中引入的Xalvi-Brunet&Sokolov算法版本生成最大协调性或非协调性网络。如果使用图7.14中讨论的算法,我们可以调整生成的度相关性的大小。
总之,静态模型,如配置或隐藏参数模型,如果我们允许多链接,是中立的,如果我们强迫它们生成简单的网络,则会发展结构的不协调性。为了生成具有可调相关性的网络,我们可以使用Xalve-Brunet&Sokolov算法。本节的一个重要结果是(11)和(13),提供了隐参数模型和增长网络的度相关函数的解析形式,在这两种情况下预测幂律k相关。这些结果为影响尺度假设(10)提供了分析支持,表明结构和动力效应都可以导致一个遵循幂律的度相关函数。
# 六.度相关性的影响
如图7.10所示,大多数真实网络都具有一定程度的相关性。社交网络是选择性的;生物网络表现出结构的非协调性。这些相关性提出了一个重要的问题:我们为什么在乎?换句话说,度相关性会改变网络的属性吗?它们会影响哪些网络属性?本节将讨论这些重要的问题。
随机网络的一个重要属性是在$$⟨k⟩=1$$出现阶段转变,标志着巨大组件的出现。图7.15显示了具有不同程度相关性的网络的巨大分量的相对大小,记录了几种模式:
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure7.jpg)
## 同配型网络
对于选型网络,阶段转换点移动到较低的⟨k⟩,因此对于$$⟨k⟩<1$$出现一个巨大组件。原因是,如果高度节点相互寻找,就更容易启动大型组件。
## 异配型网络
在非协调性网络中,由于集线器倾向于连接到小程度的节点,因此阶段转变会延迟。因此,分类网络很难形成一个巨大的组成部分。
## 大组件
对于大⟨k⟩,选型网络中的巨大组件比中立或非选型网络中的小。事实上,协调性迫使枢纽相互连接,因此它们不能吸引大量小度节点到巨大的组件。
这些在巨大组成部分的大小和结构上的变化对疾病的传播有影响,。事实上,正如我们在图7.10中所看到的,社交网络趋向于协调性。因此,高度节点形成了一个巨大的组成部分,充当疾病的“蓄水池”,即使平均而言,网络密度不足以让病毒持续存在,也能维持流行病。
改变的巨大组件对网络健壮性和也有影响,删除网络集线器将使网络分裂。在协调性网络中,移除集线器造成的损害较小,因为集线器构成一个核心组,因此许多集线器是冗余的。在非协调性网络中,删除集线器更具破坏性,因为在这些网络中,集线器连接到许多小度节点,一旦删除集线器,这些节点就会从网络中消失。
## 这里提一下度相关性的其他一些后果:
### 图7.16显示了一个重新布线的随机网络的路径长度分布,以显示不同程度的相关性。这表明在协调性网络中,平均路径长度比在中性网络中短。最显著的区别是网络直径dmax,它在选型网络中明显更高。实际上,协调性更倾向于相似程度的节点之间的链接,导致k=2个节点的长链,提高了dmax(图7.13c)。
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure8.jpg)
### 度相关性影响系统对刺激和扰动的稳定性,以及放置在网络上的振荡器的同步。
### 度相关性对顶点覆盖问题有基本影响,是图论中研究较多的问题,要求我们找到最小节点集(覆盖),使每个链接至少连接到覆盖中的一个节点。
### 度相关性影响我们控制网络的能力,改变输入信号的数量需要实现完全控制。
总之,度相关性不仅是学术上的兴趣,他们影响众多的网络特征,并有一个可识别的影响,在一个网络上发生的许多过程。
# 七.总结
度相性关最早是在2001年由Romualdo Pastor-Satorras、Alexei Vazquez和Alessandro Vespignani在互联网环境下发现的,他们还引入了度相关函数knn(k)和尺度(10)。一年后Kim Sneppen和SergeyMaslov使用与eij矩阵相关的完整p(ki,kj)来表征蛋白相互作用网络度相关性。2003年MarkNewman引入了度相关系数,并引入了选型、中性和非选型的区别。这些术语起源于社会科学:
选型交配反映了个体与相似的个体约会或结婚的倾向。例如,低收入者和低收入者结婚,大学毕业生和大学毕业生结婚。网络理论以同样的精神使用协调性,捕捉节点之间基于程度的相似性:在协调性网络中,枢纽倾向于连接到其他枢纽,小度节点连接到其他小度节点。在网络环境中,当具有相似属性的节点相互链接时,我们还会遇到传统的协调性(图7.18)。
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure9.jpg)
在某些社会和经济体系中,当个体与不同个体相结合时,异化混合也很常见。性网络也许是最好的例子,因为大多数性关系发生在不同性别的个体之间。在经济环境中,贸易通常发生在不同技能的个人之间:面包师不把面包卖给其他面包师,鞋匠也很少给其他鞋匠修鞋。
综上所述,我们关注网络中的学历相关性有以下几个原因:
•度相关性在大多数真实网络中都存在。
•一旦存在,程度相关性就会改变网络的行为。
•度相关性迫使我们超越度分布,代表控制节点彼此连接方式的可量化模式,而不是pk单独捕获的。
尽管我们付出了相当大的努力来描述度相关性,但我们对这种现象的理解仍然不完整。例如,虽然我们提供了一种算法来调整度相关性,但这个问题还远远没有完全解决。事实上,对网络度相关性最准确的描述包含在eij矩阵中。用任意的eij生成网络仍然是一项艰巨的任务。
最后,我们重点讨论了knn(k)函数,它捕获两点相关性。原则上,高阶相关也存在于某些网络中。这种三点或四点相关性的影响仍有待了解。
# 相关高级主题
## 度相关系数
我们定义度相关系数r作为程度相关的另一种度量方法。使用单个数字来描述度相关性是有吸引力的,因为它提供了一种比较在不同性质和规模的网络中观察到的相关性的方法。然而,为了有效地使用r,我们必须知道它的起源。
相关系数r背后的假设意味着knn(k)函数可以用线性函数来近似
$$k_{nn}(k)~rk$$(16)
这与标度(10)不同,标度(10)假设k依赖于幂律。式(16)提出了几个问题:
### 初始吸引力模型预测了度相关函数的幂律(13)或对数k相关。(11)中导出了隐含参数模型的类似幂律。因此,r迫使线性拟合一个内在的非线性函数。这种线性相关性不支持数值模拟或解析计算。实际上,如图7.19所示,(16)对选型和非选型网络的数据匹配都很差。
### 正如我们在图7.10中所看到的,knn(k)对k的依赖是复杂的,由于结构截断,当k较大时,往往会改变趋势。线性拟合忽略了这种内在的复杂性。
### 最大相关模型对于大的N有一个消失的r,尽管网络保持了它的度相关性。这表明度相关系数很难检测出大型网络的相关特征。
μ与r的关系
在正方,r和μ不是相互独立的。为了说明这一点,我们计算了10个参考网络的r和μ(表7.1)。结果绘制在图7.20中,表明μ和r在r为正的情况下相互关联。然而,请注意,当r为负时,这种关联就消失了。接下来,我们推导了μ和r之间的直接关系。具体来说,我们假设(10)的有效性,并确定了r的值对一个具有相关指数μ的网络。
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure10.jpg)
我们从(10)确定a开始。我们可以把度分布的二阶矩写成
$$<k^2>=<k_{nn}(k)k>=\sum_k ak^{μ+1}p_k=a<k^{μ+1}>$$
导致
$$a=\frac{<k^2>}{<k^{μ+1}>}$$
现在我们计算一个给定μ的网络的r:
$$r=\frac{\sum_k kak^μq^k-\frac{<k^2>^2}{<k>^2}}{σ_r^2}$$(17)
当μ = 0时,最后括号中的项消失,得到r=0。因此,当μ=0(神经网络)时,网络也是基于r的神经网络。对于k > 1(17)表明,对于μ>0,括号是正的,因此是r>0,对于μ<0,括号是负的,因此是r<0。因此,r和μ预测的是类似的度相关性。
综上所述,如果度相关函数为(10),则度相关指数μ的符号将决定系数r的符号:
$$μ < 0→r < 0$$
$$μ = 0→r = 0$$
$$μ > 0→r > 0$$
### 针对网络
为了测量有向网络中的相关性,我们必须考虑到每个节点i都有一个输入的ki和一个输出的ki。因此我们定义了四度相关系数rin,in,rin,out,rout,in,rout,out,捕获两个连接节点的进出线度之间的所有可能的组合(图7.21a-d)。形式上是
![Github](https://github.com/xiaoningwang/2021SocialMedia/blob/main/figure/dcy_figure11.jpg)
$$r_{α,β}=\frac{\sum_{jk} jk(e_{jk}^{α,β}-q_{←j}^α)q_{→k}^β)}{σ_←^ασ_→^β}$$(18)
其中α,β为进、出指标,q←jα为向后跟随随机链接找到α←j度节点的概率,q→kβ为向前跟随随机链接找到k度β链接的概率。σ←α和σ→β为对应的标准差。为了说明(18)的使用,在图7.21e中,我们展示了五个有向参考网络的四个相关系数(表7.1)。然而,请注意,为了得到度相关性的完整表征,最好也测量四个knn(k)函数。
总之,度相关系数假设knn(k)与k成线性关系,这个假设缺乏数值和分析支持。分析计算预测幂律形式(10)或较弱的对数依赖性(15)。然而,通常r和μ的符号是一致的。因此,我们可以使用r来快速感知网络中存在的潜在关联的性质。然而,潜在度相关性的准确表征要求我们测量knn(k)。
## 结构截断性
正如之前所讨论的,无标度属性和度相关性之间的基本冲突导致了简单网络中的结构截止。在本节中,我们计算结构截止是如何依赖于系统尺寸N的。
我们从定义
$$r_{kk'}=\frac{E_{kk'}}{m_{kk'}}$$(19)
其中Ekk '为k≠k '时k度节点与k '之间的链接数,为k=k '时连接链接数的两倍,
$$m_{kk'}=min\lbrace kN_k,k'N_k,N_kN_{k'}\rbrace$$(20)
为Ekk '的最大可能值。(7.25)的起源见图7.22。因此,我们可以将rkk '写成
$$r_{kk'}=\frac{E_{kk'}}{m_{kk'}}=\frac{<k>e_{kk'}}{min\lbrace kP(k),k'P(k'),NP(k)P(k')\rbrace}$$(21)
由于mkk '是Ekk '的最大值,对于任意k和k ',必须使$$r_{kk '}≤1$$。严格地说,在简单网络中$$r_{kk '} > 1$$不能存在的度对。然而,对于某些网络和k,k'对rkk'大于1。这显然是非物理的,表明网络配置中存在一些冲突。因此,我们将结构截止点定义为方程的解
$$r_{k_sk_s}=1$$(22)
注意,一旦$$k > Npk '$$和$$k ' > Npk$$,就能感受到对多个链接的限制作用,使rkk '的表达变成
$$r_{kk'}=\frac{<k>e_{kk'}}{Np_kp_k'}$$(23)
对于无标度网络,这些条件在区域k,$$k'>(aN)1/(γ+1)$$中得到满足,其中a是一个依赖于pk的常数。注意,这个值低于自然截止值。因此,这种缩放为结构截止值提供了一个下界,在这种意义上,每当度分布的截止值低于这个极限时,条件rkk ' < 1总是满足的。
对于神经网络,联合分布分解为
$$e_{kk'}=\frac{kk'p_kp_k'}{<k>^2}$$(24)
因此,比率为
$$r_{kk'}=\frac{kk'}{<k>N}$$(25)
因此,保持条件$$r_{kk '}≤1$$所需的结构截止值形式为
$$k_s(N)~(<k>N)^\frac{1}{2}$$(26)
注意(26)与底层网络的度分布无关。因此,对于无标度网络ks(N)与度指数γ无关。
# 八.参考文献
1.ALBERT-LÁSZLÓ BARABÁSI. NETWORK SCIENCE[M].2014