复杂网络是由数量巨大的节点和节点之间错综复杂的关系共同构成的网络结构。用数学的语言来说,就是一个有着足够复杂的拓扑结构特征的图。复杂网络具有简单网络,如晶格网络、随机图等结构所不具备的特性,而这些特性往往出现在真实世界的网络结构中。复杂网络的研究是现今科学研究中的一个热点,与现实中各类高复杂性系统,如互联网、神经网络和社会网络的研究有密切关系。
互联网是可以到达最大量人群的最快捷、最高效的方式,这是由网络的拓扑和结构决定的。
拓扑:拓扑一般指的是数学的一个分支,应用于计算机通信和网络等领域就是网络拓扑,指构成网络的成员间特定的排列方式。如果两个网络的连接结构相同,它们的网络拓扑相同,尽管它们各自内部的物理接线、节点间距离可能会有不同。在日常生活中,我们接触最多的是以太网,以太网(Ethernet)是一种计算机局域网技术,是目前应用最普遍的局域网技术,以太网的标准拓扑结构为总线型拓扑,但目前的快速以太网为了减少冲突,将能提高的网络速度和使用效率最大化,使用交换机来进行网络连接和组织。如此一来,以太网的拓扑结构就成了星型;但在逻辑上,以太网仍然使用总线型拓扑。
世界万物之间存在着广泛的链接关系,在社会、信息、生物、经济等等各种领域,都存在着复杂网络,具有普适性。规律的普适性是科学发展孜孜追求的目标,各个领域形形色色的网络,都呈现出共有的无尺度、小世界和高聚团性,从微观尺度的基因网络到宏观尺度的经济网络,无不蕴含着枢纽节点和层级结构。
还原论(Reductionism)是主张把高级运动形式还原为低级运动形式的一种哲学观点。这种观点认为,现实生活中的每一种现象都可看成是更低级、更基本的现象的集合体或组成物,因而可以用低级运动形式的规律代替高级运动形式的规律。
将各个部分进行重新组织,要比科学家们想象的难得多,原因很简单,在沿着还原论这条路飞奔时,我们撞上了复杂性这堵墙。将各个部分按照多种方式的组合,需要花费难以承担的时间,但是,大自然却以一种优美和精确的方式将它的各个组成部分拼接在了一起。
我们对于自然界整体的理解没有突破,自然界的神奇之处在于它利用了包罗万象的自组织法则,这个法则仍然是个未知之谜。
网络推动我们重新审视帮助我们形成世界观的一些根本问题。
随机网络是指通过随机连接节点搭建起来的网络。在随机网络中,链接是完全随机放置的,所有节点有相等的机会获得链接。只要网络足够大,几乎所有节点拥有的连接数都基本相同。因此,随机网络是一个高度平等的网络。
图论:图论是数学的一个分支。图论中的图是由若干给定的点及链接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的现表示相应两个事物间具有这种关系。
图论是考察网络的基础。图或网络具有一些隐藏在自身结构背后的性质,这些性质可以胭脂或者增强我们在网络中所能施展的能力。
随机选择网络中的节点对进行链接,会出现一些特殊的现象:当添加的链接数超过一个临界值时,网络将发生剧烈变化。在到达这个临界值之前,网络中包含许多不连通的小节点簇,每个节点簇对应只在内部进行交流的一组人。到达临界值之后,网络中将出现巨大的节点簇,几乎所有人都被链接在这个巨大的节点簇中。数学家们把这这个现象成为巨大连通分量的涌现,物理学家把这个现象成为渗流,并把巨大连通分量的涌现称为相变。
涌现(英语:emergence,或译为突现、呈展)是一个复杂系统中由次级组成单元间简单的互动所造成的复杂现象,此为复杂系统重要的特性之一。也有人定义为:复杂系统中在自我组织的过程中,所产生的各种新奇且清晰的结构、图案、和特性。如下图的白蚁塔被视为涌现的典型例子。
埃尔德什和莱利第一个之处,从社会网络到电话网络,真实的图都不是漂亮的规则图,而是极其复杂的。鉴于这些网络的复杂性,埃尔德什和莱利假定这些网络是随机的。
随机网络理论告诉我们,当节点的平均链接数增加到超过临界值1时,游离在巨大节点簇之外的节点数成指数下降。也就是说,添加的链接数越多,越难找到保持孤立的节点。
泊松分布(Poisson distribution),是一种统计与概率学里常见到的离散机率分布。泊松分布是以18~19 世纪的法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)命名的,他在1838年时发表。泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。泊松分布有一个明显的峰值,在峰值的两侧,泊松分布快速衰减。
没有链接,网络世界就是互联世界的信息废墟。
毕达哥拉斯定理,就是我们所说的勾股定理(英语:Pythagorean theorem),是平面几何中一个基本而重要的定理。勾股定理说明,平面上的直角三角形的两条直角边的长度(古称勾长、股长)的平方和等于斜边长(古称弦长)的平方。反之,若平面上三角形中两边长的平方和等于第三边边长的平方,则它是直角三角形(直角所对的边是第三边)。勾股定理是人类早期发现并证明的重要数学定理之一。
六度分割,六度分割是指平均来说,社会网络中任意两个素不相识的人之间,最多只需经过6步就可建立相互联系。也就是说,最多通过六个人你就能认识任何一个陌生人。六度分割现象由哈佛大学教授斯坦利·米尔格拉姆的开创性实验发现。
为什么拥有数十亿节点的社会网络间隔如此之小,答案是这些网络都具有高度互联的特性,六度分割是现代社会的产物,一方面是由于人们乐于进行社会交际,另一方面也得益于现代通讯技术,各种通讯技术削弱了物理距离对社会链接的影响。
高度互联的网络中,节点间隔和网络规模的对数有关(d=log N / log k),对数让大型网络变小了,在我们身边形成很多小世界。
小世界网络是一类特殊的复杂网络结构,在这种网络中,大部分节点彼此并不相连,但节点之间经过少数几步就可达到。
聚团性是指在网络中,同一个顶点的邻点之间有更大的概率有边链接的现象,简单来说,就是我们的密友之间往往也是朋友。它是复杂网络拓扑的一个重要特性,源于小世界网络模型,通常使用聚团系数来衡量。
聚团系数由瓦茨和斯托瓦茨提出,用来度量聚团性。聚团系数等于实际链接数除以最多能够形成的链接数。
强关系:是格兰诺维特提出的一个概念,指我们的朋友圈内部关系,这些朋友都互相认识。
弱关系,是指不同朋友圈之间的熟人关系。
格兰诺维特认为,无论是找工作、获取消息、开餐馆,还是传播新潮流,弱社会关系比我们所珍视的强社会关系更重要。
自组织现象:自组织是从最初的无序系统中各部分之间的局部相互作用,产生某种全局有序或协调的形式的一种过程。这种过程是自发产生的,它不由任何中介或系统内部或外部的子系统所主导或控制。比如观众从稀稀拉拉地鼓掌到整齐划一、有节奏地鼓掌。
聚团现象不止出现在社会网络中,也存在于食物链网络、经济网络、万维网、细胞网络中,可以说,聚团现象无处不在。聚团现象从社会的独特性质提升为复杂网络的普遍性质。
枢纽节点,是指网络中少数连接度非常高的节点。例如,在人类社会中,枢纽节点是指少数认识很多人的人。在存在枢纽节点的网络中,网络结构由枢纽节点支配,从而使网络呈现出小世界特性。
《引爆点》作者马尔科姆·格拉德威尔经过测试,发现在各行各业中都有一小群特别善于交际的人,他们是社会中的连接者。
网络的真正中心位置属于那些在多个大圈子里都有位置的节点。
科学家能够研究的大多数复杂网络中都存在枢纽节点,枢纽节点无处不在,是复杂网络中的普适组件。
在存在枢纽节点的网络中,网络的结构由枢纽节点支配,从而使网络呈现出小世界特性。
幂律分布,是一条没有峰,且不断递减的曲线,它最突出的特征是大量微小事件和少数非常重大的事件并存。
每一个幂律都有一个独一无二的幂指数,幂指数通常还叫做度指数。在网络中,幂律可用于描述度的分布。
在连续的层级中,无法找到一个能够代表所有节点特性的节点。在这些网络中不存在固有的尺度,因此,巴拉巴西把拥有幂律度分布的网络称为无尺度网络。
无尺度网络是遵循幂律分布的网络。网络中大多数节点只有很少几个链接,它们通过少数几个高度连接的枢纽节点连接在一起。人们发现,包括万维网、好莱坞、科学家、细胞网络在内的大多数重要网络都是无尺度的。
在网络中观察到的幂律,表明网络和其他自然现象之间存在着联系,从而将网络置于理解一般复杂系统的最前沿。
为什么每当复杂系统自发涌现出秩序时,总会出现幂律?美国物理学家提出了“重整化”理论,通过给出尺度不变形的严格数学基础,每当接近从无序到有序的临界点时,威尔逊的理论总能推导出幂律。
相变理论告诉我们,从无序到有序的道路,是自组织在强有力地推动,并通过幂律铺就。它还告诉我们,幂律不仅是刻画系统行为的另一种方式,更是复杂系统自组织所独有的特性。
为什么会有枢纽节点?为什么会出现幂律?巴拉巴西引入生长机制和偏好连接。生长机制让资历老的节点具有明显的优势,让它们拥有最多的链接,偏好连接引入了富者愈富的现象,帮助连接度较高的节点得到更多的链接,而后来者的链接数会相应地减少。
无论网络变得多么大、多么复杂,只要偏好连接和生长机制出现,网络都将保持由枢纽节点主导的无尺度拓扑。
网络演化由偏好连接这个微妙而不可抗拒的定律支配着。受该定律的影响,我们会在无意间以更高的速度向已经拥有大量链接的节点添加新链接。
无论是创业公司,还是知名公司,为什么要将大量资金花费在广告上。目的只有一个,对抗随机性,想通过让其他人将链接指向它们,获得非随机性带来的优势。
在富者愈富的世界里,后来者如何取得成功呢?适应度模型在无尺度模型的基础上引入了竞争因素,在无尺度模型中,我们假设节点的吸引能力仅仅由它的链接数决定,但在竞争环境下,适应度也发挥了作用:适应度的出现,使得先发者不一定是最后的胜者。相反,适应度主导着一切,制造和打破枢纽节点。
如果我们想要解释在大多数网络中所看到的激烈竞争,就不得不承认每个节点都是不同的。
对于玻色-爱因斯坦凝聚而言,所有的粒子都挤在最低能级,其他的能级没有粒子出现。玻色-爱因斯坦凝聚从理论上证明了,在某些系统中,胜者可以占有所有的链接。与此类似,在某些网络中,适应度最好的节点理论上可以获得所有的链接,其他节点则一无所有。这就是胜者通吃。
所有网络按照拓扑可以分为两个可能的类别。在大多数网络中,竞争对于网络拓扑没有明显的影响,在这一类网络中,对于链接的竞争虽然激烈,无尺度拓扑却依然存在,只不过适应度最高的节点最终会成为最大的枢纽节点。但是,在某些网络中,胜者占有所有的链接,这是玻色-爱因斯坦凝聚的明显标志。
健壮性与脆弱性都根源于无尺度网络的结构不均匀性。无尺度网络具有面对故障的健壮性,同时具有面对攻击的脆弱性。
在无尺度网络中,并不存在需要删除很多节点才能达到这一临界点。让少数几个枢纽节点失效就可以使无尺度网络迅速分裂成碎片。
枢纽节点在营销中通常被称为“意见领袖”,社会学家和营销专家早就知道这些意见领袖的存在。然而,之前他们一直把枢纽节点视为特殊现象,并不清楚他们为什么存在、究竟有多少。而无尺度网络的框架为枢纽节点的存在提供了理论依据。
社会学家与流行病学家发明了一种非常有用的工具,叫作“阀值模型”,在扩散模型中为每一个人赋予一个阀值,来量化这个人接受某个创新的可能性,大多数人的阀值都高于零。在对传播和扩散的理解方面,最重要的概念性进步是,认识到了时尚与病毒等等传播的必备条件是传播率要超过临界阀值。
帕斯特-萨托雷斯和维斯皮那尼第一次在真实的无尺度网络上研究扩散现象,结果发现:在无尺度网络上,传播阀值奇迹般地消失了,即便病毒不那么具有传染性,仍然能够传播和存活,这颠覆了过去五十年关于扩散的研究积累下的所有结论,无尺度网络上传播的病毒根本没有碰到任何阀值。这种高度异常的行为源于互联网不均匀的拓扑,无尺度网络是由枢纽节点主导的。这些研究得出的结论,促使我们重新审视传播的方方面面。
互联网提供的丰富数据,使得传播和流行病的研究范式有可能发生变革。
同为计算机科学家的希腊三兄弟发现,互联网路由器的连通性遵循幂律分布,由各种路由器通过物理线路连接起来的互联网,是一个无尺度网络。
万维网中的链接是有方向的,而不是双向。有向性最重要的影响结果是万维网并非一个单一均匀的网络。实际上,万维网分裂成四块主要的大陆。第一块大陆包括了全部万维网页面的1/4,该部分通常被称为中央核心,囊括了所有的主流网站。第二块和第三块大陆被称为IN大陆和OUT大陆,从IN大陆出发能够到达中央核心,但是中央核心没有路径能让你返回IN大陆,而OUT大陆则相反。OUT大陆上主要是公司网站。第四块大陆有卷须和分散的岛屿组成,这些岛屿是由仅存在内部链接的网页组成的孤立组,无法从中央核心到达,也没有到达中央核心的链接。
所有的有向网络都会分裂为相同的四块大陆,研究人员指出,这些大陆的规模和结构能够解析地预测出来。
万维网的大规模拓扑结构,给万维网上我们的行为和可见性施加了更严重的限制,远超过政府或产业仅通过更改代码所能达到的程度。
无论我们研究哪一级别的组织,都能找到相同的、支配着自然界网络的、稳定而通用的法则。经济研究和网络研究所面临的挑战,是如何将这些法则应用于实践。
针对基地组织的战斗,获胜的途径,或是去除足够多的枢纽节点使网络到达分崩离析的临界点;或是切断其资源供应,促使其内部发生级联故障。恐怖份子网络只是利用了伊斯兰好战分子的愤怒,并充分利用了自组织法则。如果我们想彻底赢得这场战争,唯一的希望是从促进恐怖分子网络生长的社会、经济、政治根源处出发,使那里的人们有机会融入到更具建设性、更有意义的网络中。
从语言网路到性关系网络,具有现实意义的大多数网络都是由同样的普适法则塑造的,因此具有同样的由枢纽节点支配的架构。