02 复杂网络分析中的基本概念
- 2.1.复杂网络的表达方式
- 2.2.度、平均度、度分布
- 2.3.路径、距离与介数
- 2.4.集聚系数
- 2.5.网络稀疏性与联通性
- 2.6.度相关性
- 2.7.富人俱乐部
- 2.8.有向网络
- 2.9.加权网络
2.1复杂网络的表达方式
哥尼斯堡七桥问题
1736年 欧拉定理
如果图具有两个以上的奇数度的节点,则没有路径;如果图是连通的且没有奇数度节点,则它至少有一条路径。
- 网络的可视化表达 图表达
组成部分 | 节点,顶点 | N=6 |
---|---|---|
相互作用 | 连边,边 | L=5 |
系统 | 网络,图 | (N,L) |
节点,顶点之间的相互作用,表达成连边或者是边,如此,网络变成了一个系统。该系统是由节点与节点之间相互作用抽象出来的连边所构成的
2. 集合表达
点集
边集
,
,
网络
,由点集
和边集
组成一个图,可分为无向、有向和加权网络
令
,每条边
有
中的一对点
与之对应;如果任意
与
对应同一条边,则称无向网络,否则成为有向网络;如果任意
,则称无权网络,否则称为加权网络。
3. 链接矩阵
两个节点之间有边存在所对应的位置取值为1 无边则放0
在链接矩阵基础上,构造Laplace矩阵
;
为网络链接矩阵,
为对角矩阵,对角线上的元素对应的网络中各个节点的度。
链接矩阵及其对应的拉普拉斯矩阵的特征值和特征谱分析可以提供帮助。
什么是网络拓扑
网络是一个由多个节点组成的集合,节点之间有一定的连接。
拓扑指的是节点之间相互联系的模式
实例 | 节点 | 连接 |
---|---|---|
国际互联网 | 路由器 | 光纤 |
科学引用网 | 文章 | 文章引用 |
社会网络 | 个体人 | 人际关系 |
2.2度、平均度、度分布
- 度
- 节点的度:与节点直接相连的连边数
- 通常,节点的度值是一个离散型随机变量,在计算中主要涉及以下统计量
- 均值
- 方差
- 标准差
- n阶矩
- x的分布
- 平均度
-
-
- :图中节点数
- :图中连边数
- 度分布
- 将网络中节点的度值从小到大排列,统计值为k的节点,占整个网络节点数的比例
,即
- 度为k的节点数目
- 网络中的节点总数
- 连续性变量表述:节点的度的概率密度函数
- 归一化条件
- 是网络所有节点的度值中的最小值,一般从1开始取。
- 正则网络的度分布
- 全连接网络:n-1
- 最近邻居连接网络:
- 星型网络:中心点(特殊点):n-1;其他点(边缘点):1
2.3路径、距离与介数
- 路径
- 一条路径是指一个节点序列,其中每一对相邻的节点之间都有一条连边。
- 一条从节点 到 的长度为n的路径P经过n+1个节点和n条连边。
- 最短路径
- 两个节点之间的最短路径是指连接这两个节点的变数最少的路径。
- 两个节点之间的最短路径上的边数目,即两个节点之间的最短距离。
- 两点之间路径的条数
两点间路径的条数。- 如果节点 和 之间存在一条连边,则 ,反之,
- 如果节点 和 之间存在一条长度为2的连边,则 ,反之,
- ……
- 长度为n,如果节点 和 间存在一条长度为n的路径,则 ,否则, 。
- 在节点ij之间长度为n的路径数量:
=
- 网络直径与平均距离
- 直径 :网络中任意两点间的最短距离的最大值。
- 平均路径长度(平均最短距离)
- 连通图
- 无向图
将网络中任意一堆节点之间的最短距离求出来后进行求和,然后再除以这个网络当中节点对的数目。
直径 3;平均距离9/5
- 实例
- 全连接网络:平均距离为1
- 最近邻居网络:平均距离为N/8
- 星型网络:平均距离为
- 介数
- 任意一堆节点间的最短路径所经过的次数
- 点介数
- 边介数
- 介数反映了响应的节点或边在整个网络中的作用和影响力,是一个全局几何量。
2.4集聚系数
- 节点集聚系数的定义1
- 节点
的
个邻居节点之间实际存在的变数
和总的可能边数之比。
指i点邻居之间存在连边的个数;
指i点的度值;
- 节点
的
个邻居节点之间实际存在的变数
和总的可能边数之比。
- 网络集聚系数定义
网络中所有节点的集聚系数的平均值-
网络的传递性 -
如果T=1,则任意两个节点有连接。
如果T=0,则无三角形连接。
-
2.5网络稀疏性与连通性
-
完全连接网络
定义:如果一个网络中任意两个节点之间都有连边存在,则称之为完全连接网络,平均度为N-1
可能拥有的最大连边数:
= ma -
网络稀疏性
定义:网络稀疏程度定义为网络中实际存在的边数与最大可能的边数之比。
/
L:网络中实际存在的边数
利用比值衡量稀疏程度,很多网络是稀疏网络 -
无向网络的联通
- 联通(无向)图:网络中任意两个节点之间都至少存在一条路径
- 最大连通集团:含有节点数最多的连通子图
- 对于不连通网络的邻接矩阵,所有的非零元素都存在于沿着矩阵对角线排列的一些方块中,其余部分元素均为零。
+(一般会选择最大连通集团进行性质分析
2.6度相关性
- 众多的社会关系网络,呈现出正向匹配特性;信息网络和神经网络则呈现出负向匹配特性;而常用的ER模型和BA模型则没有任何倾向性。2
- 网络中两个节点度值之间的关系
- 同配:度大节点 倾向于连接 度大节点(对角线)
- 异配:度大节点 倾向于连接 度小节点(两轴)
- 中性:节点间的连接与它们自身的度值无关
- 衡量网络的度度相关性
- 可视化描述3
- :网络中随机选取的一条边的两个端点的度分别为 和 的概率
- :网络中随机选取的一条边的断电的度为k的概率。
- 如果网络不具有度相关性:
- 计算 ,并对其进行可视化,观察分布,判断网络度度相关性。
- 度相关函数4
- 平均邻居度
:度为k的节点的邻居节点的平均度。
- :同配
- :中性
- :异配
- 平均邻居度
:度为k的节点的邻居节点的平均度。
- 相关系数
如果网络是度相关的, ,可以考虑-的差值大小来刻画网络同配或异配的程度。
正值,同配;0,中性;负值,异配。- 为了比较不同规模网络的同配或异配程度,通过归一化处理得到归一化的相关系数。
- 皮尔逊相关系数
取出网络中所有连边,计算每条连边两端节点的度值,并将其按从小到大排序,得到度小序列和度大序列,最后计算它们的皮尔逊相关系数。
- 可视化描述3
2.7富人俱乐部
研究Internet的AS拓扑过程中发现,虽然AS拓扑具有异配特性,但高度节点之间仍然具有很高的连接概率,这个现象成为富人俱乐部现象。引入夫人俱乐部系数来对富人俱乐部现象进行量化描述。5
- 富人俱乐部系数:$\phi(k)=
E
>k
/
>k
>k
-1)$
- :网络中度值大于k的节点之间的连边数。
- :网络中度值大于k的节点数。
- 标准化后的富人俱乐部系数6
2.8有向网络
- 有向网络:在网络的连边上面存在方向。方向体现在链接矩阵中为非对称性;对角线为0
- 度的进一步划分
- 节点 的出度 从节点i指向其他节点的边数目
- 节点 的入度 从其他节点指向节点i的边数目
- 节点的度(总度) 节点的入度和出度的加和
- 源 一个节点的入度
- 汇 一个节点的出度
- 平均度
- 平均入度
- 平均出度
- 总平均度
总平均入度=总平均出度
- 路径、最短距离
在有向网络中,路径只能沿着箭头的方向。因此,在有向网络中,从A到B的最短距离可能不等于从B到A的最短距离。 - 有向网络的集聚系数7
- 有向网络的连通
将有向网络中的所有有向边替换为无向边,替换后的无向网络是一个连通图,则称该有向网络是一个弱连通图。
强定义:有向网络中必须任何两个节点之间都存在路径,强连通图。 - 度相关8
实例食物网:一条有向边由节点A指向节点B,表示物种B以物种A为食物。四种模式下的度度相关性。- (out,in)
- (in,out)
- (out,out)
- (in,in)
- 有向网络的模体9
有向网络和随机网络模体,随机网络的生成方式10,随机交叉换边,并且保证每个节点的入度和出度不变。
可以利用有向网络对实体系统进行抽象,再通过与随机化有向网络进行对比可以挑选出系统当中所存在的个数居多的模体模式。而模体模式可以揭示系统所具有的一些特征
2.9加权网络
- 多条边网络
节点之间对应的多条连边=>链接矩阵所对应位置上元素的数值表达。依旧可以利用无权网络的公式计算边数、平均度,链接矩阵也同时保持着对称的特征。 - 权重
- 权重(点、边)
- 加权网络中加权的赋予
加权方式:
a)利用网络中已有的物理量进行权重的抽象:因特网——带宽;电路网——电阻
b)相互作用的抽象:科学家合作网——合著文章数;演员合作网——合作次数;中药网;菜肴网
- 双顶点网络的抽象
顶点——事件 构成双顶点网
广义合作网投影到单顶点网 - 关于权重的定义11
- 相似权(Similarity Weight):概念与距离相反,边权越大,顶点之间越亲近(0为无连接)如合作次数
- 相异权(Dissimilarity Weight):概念与距离相同,边权越大,顶点间距离越远(∞为无连接)如里程数
- 节点距离计算
- 相异权
- 相似权
- 加权网络集聚系数
加权网集聚系数的定义满足以下4个条件12:- 在[0,1]之间
- 权重为0则无边连接
- 权重为1时回归无权网定义
- 与三角形每条边上的权重相关
文献给出了加权网络集聚系数的公式
参考文献
Watts, D.J. and Strogatz, S.H. (1998) Collective dynamics of “small world” networks. Nature, 393, 440-442. ↩︎
Newman, M. E J . Assortative Mixing in Networks[J]. Physical Review Letters, 2002, 89(20):208701. ↩︎
Maslov, S. Specificity and Stability in Topology of Protein Networks[J]. Science, 2002, 296(5569):910-913. ↩︎
Pastor-Satorras, Romualdo, Vázquez, Alexei, Vespignani, Alessandro. Dynamical and Correlation Properties of the Internet[J]. Physical Review Letters, 87(25):258701. ↩︎
Zhou S, Mondragon RJ. The rich-club phenomenon in the Internet topology. IEEE Communications Letters, 2004.8(3):180- 182. ↩︎
Colizza, V.,Flammini, A.,Serrano, M. A., & Vespignani, A. . (2006). Detecting rich-club
ordering in complex networks. Nature Physics, 2(3), 110-115. ↩︎Fagiolo, Giorgio. Clustering in Complex Directed Networks[J]. Phys Rev E Stat Nonlin Soft Matter Phys, 2006, 76(2):026107. ↩︎
Jacob G. Foster, David V. Foster, Peter Grassberger,等. Edge direction and the structure of networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010. ↩︎
Milo R , Shen-Orr S , Itzkovitz S , et al. Network Motifs: Simple Building Blocks of Complex Networks[J]. Science, 298. ↩︎
Maslov, S. Specificity and Stability in Topology of Protein Networks. Science, 2002, 296(5569):910-913. ↩︎
FAN, YING, LI, MENGHUI, CHEN, JIAWEI,等. NETWORK OF ECONOPHYSICISTS: A WEIGHTED NETWORK TO INVESTIGATE THE DEVELOPMENT OF ECONOPHYSICS[J]. International Journal of Modern Physics B, 18(17n19):2505-2511. ↩︎
Petter Holme, Sung Min Park, Beom Jun Kim,等. Korean university life in a network perspective: Dynamics of a large affiliation network[J]. Physica A Statistical Mechanics & Its Applications, 373(none):821-830. ↩︎