拱北中学【群体智能】从乌合之众到群体智慧的一步之遥;一文读懂复杂网络与群体智慧-产业智能官
2020年06月19日【群体智能】从乌合之众到群体智慧的一步之遥;一文读懂复杂网络与群体智慧-产业智能官
“产业智能官”:工业互联网的未来
人工智能起源于1956年,但直到最近才爆发,这期间核心在于互联网的发展臧雅菲,催生的大数据。工业互联网的发展,千万台设备的互联,边缘计算植入,都将催生更高级的智能。
可能单个机械臂所具有的计算处理能力有限,但互联之后,这些庞大群体就有可能产生所谓的群体智能。
所谓群体智能,是指无智能或仅具简单智能的个体通过分布式、自组织式的群体协作,涌现出高级宏观智能行为的特性。人脑其实也是无数智愚部分相互连接而出现的高级智能。大脑皮层的每一个不同部位,都能控制人体不同功能,有的部位专门控制视觉、有的部位专门控制听觉。
同样,如果只是把某一部分拿出来,它的智慧不会和一只蚂蚁有太大区别,正式由于神经网络的互联,才出现了意识、记忆、逻辑判断等高级智慧行为。
工业互联网通过将全球所有设备互联,每一台设备、每一个边缘计算器,它所拥有的智慧极其有限,但当他们实现互联,实现大规模协作后一念起明月珰,它们也必将实现某种智能。当然现有人工智能也在不断的进化,通过工业互联产生的海量数据,不断喂食,现有小学水平的人工智能,也将很快进化到大学、研究生水平……论文解读:从乌合之众到群体智慧的一步之遥
图片来源:iStock
导语
除了人工智能,人类的群体智能也是一块未充分挖掘的宝藏。特别是随着互联网的发展,每个人类个体的意见都更加容易收集。我们应如何聚合每个人类个体意见成为了一个极其重要的具有现实意义的问题。
群体与个体相比,是更聪明还是更愚蠢?古语中既有“三个臭皮匠郊游简谱,顶个诸葛亮”,也有“三人成虎”。发表于英国皇家学会 Journal of the Royal Society Interface的最新文章显示,要想避免集体愚蠢、提升群体智慧,需要掌握估计偏差和社会影响规律。本文是对这项研究的详细解读。
论文题目:
Counteracting estimation bias and social influence to improve the wisdom of crowds
论文原文:
http://rsif.royalsocietypublishing.org/content/15/141/20180130
将多个非专家意见整合为集体估值,在许多情况下可以提高预估的准确度。然而,个体估计偏差和个体间信息共享这两种错误来源也可能会削弱群体的智慧。
首先,文章研究了现有的聚合方法(如算术平均值或中位数),平均数往往会高估真实值,而中位数往往会低估真实值。通过量化估计偏差,将个体偏差映射到集体偏差,帮助设计并且验证三种新的聚合方法,有效地削弱集体估计的误差。
此外,研究者进一步实验,量化个人估计与社会信息结合时的社会影响规律。发现,修正的均值准确度较少受社会影响,无论存不存在社会影响,对不同数量任务和获取平均社会信息的方法,它所提供的估值都高度准确。因此,掌握估计偏差和社会影响的规律是提高群体的智慧的途径。
1.研究背景与目的
1.1群体的智慧:
汇总个体估计,提高集体估计的准确性
在线社交平台的流行使得民众对政治选举、政府决策或金融市场等多种主题的意见得以表达并迅速传播。其中,非专业人士贡献了大部分意见,因此可能普遍认为他们的估计可能预测准确度较低。然而,经验表明,聚合这些非专业看法,通过取估计集合的算术平均值或中位数,所得到的“集体”估计通常是高度精确的。除人类外,动物实验也得到了类似的结果。这表明,汇总不同个体的估计是提高估计准确性的良策,甚至在不同语境、对不同物种亦有效。
图片来源:The economist
1.2 理论与方法的界限①:
个体估计偏差
大数定律为“群体的智慧”提供了理论支持:如果个人的估测误差具有无偏性,且以真实值为中心,那么平均多人的估计将越发接近真实值。然而,个体决策往往做不到理论假设中的无偏差。
为提高集体估计的准确性,已经提出了许多聚合方法,如几何平均,算术平均值和中位数和'修剪均值'(修剪估计分布的尾部,然后算术平均值由截断分布计算)。虽然这些方法在某些情况下能够提高准确度,但未解决集体偏差的根本原因(即个体估计误差)。因此,我们不能将其推广到其他领域,也无法继续优化它们以逼近真实值。
1.3 理论与方法的局限②:
信息共享带来的社会影响
许多群体的智慧的模型认为观点独立于环境,但现实中,个体间往往会分享信息从而互相影响,因此他们的估值一定程度上相关。由于个体对社会信息的反应规律不同,社会影响不仅会使得估计值的分布更加集中,还可能让估计值的分布产生左偏或者右偏。例如,有着极端观念的个体如果固执己见,集体估计则倾向于转向这些意见。简而言之,即使孤立的个体估计不存在误差,社会影响也可能导致估计偏差的产生。
因此,量化个体估计和社会信息对集体估计的影响,对于优化群体的智慧、探索其边界至关重要。这有助于发现现有的最准确的聚合方法,还可以帮助设计可以削弱误差的新方法,最终能够比已有的方法具有更高的准确性和稳健性。
信息共享"摧毁"群体智慧。图片来源:The Euronext Amsterdam floor (Perpetualtourist2000).
因此,量化个体估计和社会信息对集体估计的影响,对于优化群体的智慧、探索其边界至关重要。这有助于发现现有的最准确的聚合方法,还可以帮助设计可以削弱误差的新方法,最终能够比已有的方法具有更高的准确性和稳健性。
2.实验与发现
2.1 实验(一):量化估计偏差
2.1.1 实验方案
在第一个实验,研究者收集了5个新的数据集,并分析了文献中的8个现有数据集。研究者采用了著名集体智慧任务,'糖果罐'数量估计问题,即孤立个体(不考虑社会影响)估算一个罐子中的物品数目(如图1a所示),用以研究个体估计误差。新的数据集中,估计对象数量J和参与者人数n分别为:54(n = 36),139(n = 51),659(n = 602),5897(n = 69)和27852(n = 54)。
如图1b所示,图1b的估计直方图(灰色柱)非常接近对数正态分布(黑色实线)。μ(算术平均值)和σ(标准差)这两个描述对数正态分布的参数,均与罐内物体数量的对数呈线性关系(图1c和图1d)。
图1.数量对估计分布的影响。
实线:最大似然估计;阴影区域:95%置信区间。
2.1.2 现有聚合方法的误差:算术平均数,中位数
如图2a所示,由于对数正态分布具有长尾效应(图1b),夸大了平均值,算术平均值请相互高估实际数量;中位数倾向于低估真实值,表明大多数人低估了真实的数字,与其他研究的结论相符。平均值和中位数的高估和低估程度大致相同,未发现这两种聚合方法的一致性差异(图2b)束氏畜猫。
此外,根据该模型的预测,如果物体数量过小(非实验测试范围),参与者会同时高估均值和中位数,有较大的相对误差。因此,该模型仅适用于本实验测试的范围,应避免泛用结论。
图2.(a)算术平均值和中位数与实际物体数量相比和(b)二者的相对误差。实线表示最大似然值;阴影区域表示95%置信区间;实心圆圈表示来自五个数据集的经验值。
2.1.3 设计并测试新的聚合方法:削弱估计偏差
修正的平均值与中位数:
对于对数正态分布,平均值的期望值是:??,中位数的期望值是:??。
如图1c、d所示,我们从估计偏差的经验测量得出了最佳拟合关系:??和??。
作者将前两个方程中的μ和σ替换为最佳拟合关系,然后求解J,这是对真实价值的“修正”估计。
由此,可以计算出“校正”的算术平均值:?
和“更正”的中位数:
该方法同样适用于其他的估计任务,估计分布和估计偏差。
最大似然:
不像修正的平均值或修正的中位数,最大似然方法将估计值的全集用于计算新的集体估计。再次调用图1c、d得出的最佳拟合关系锦绣江南四期,这意味着,对于一个给定的物体实际数目J,预期它将服从对数正态分布并且参数分别为:和。因此,根据J计算各关联对数正态分布产生给定估计集合的可能性,使可能性最大的数就是真实值的集体估计值。
2.1.4 聚合方法的影响因素①:训练样本规模
如图3a,新的聚合方法均优于旧有方法,减少了58-78%的错误。比较三种新方法,最大似然方法表现最佳,其次是修正的均值,而修正的中位数整体精度最低。
随着训练数据集大小的增加,准确度有了很大的提高(图3b)。就实验所得样本而言,需达到200个样本,新的聚合方法才能得到较高的准确度。
图3.聚合方法的整体相对表现。图3(a)中蓝色代表大于50%,即表格行所示方法较优,红色代表小于50%,即表格列所示方法较优。
2.1.5 聚合方法的影响因素②:测试数据集的规模,误差容限
接下来研究了测试数据集的规模对准确性的影响。文中“误差容限”定义为聚合方法的最大可接受误差,并根据每种方法达到给定容限的概率('容忍概率')绘制图表。如果测试数据集规模相对较大,则三个新的聚合方法优于五个标准方法(图4b,c)。然而,当估计对象数量大且测试数据集样本数量相对较小时,聚合方法的相对准确性取决于误差容限,可能存在着标准方法优于新方法的情况。
图4.测试数据集大小和容错级别如何影响聚合方法的相对准确性。聚合方法表现出相对误差(定义为|X - J|/ J,其中X是聚合方法值)的概率小于给定的容错度。N为测试数据集规模,物体数量J = 22 026(ln(J)= 10)。
2.2 实验(二):量化社会影响的规律
2.2.1 实验方案
然后,研究者选定物体数量为659的数据集,控制社会信息以探究个体在估算任务中遵循的社会影响规律。作者量化了各种聚合方法的准确性,并设计了新的聚合方法来削弱个体偏见和社会因素的影响,从而提高集体估计的准确性回首萧瑟处。
首先,参与者独立做出初始估值G1。接下来,参与者收到与其估计存在一定差异的“社会”信息S,并得知他们这是前面N位参与者的平均估计值(N为社群规模)。其中,一半参与者会随机收到G1/2到G1区间的社会信息(服从G1/2到G1区间的均匀分布),而另一半则会从G1至2G1中抽取(服从G1至2G1区间的均匀分布)。然后,参与者可以修改它们的初始猜测,做出第二次估计G2。通过人工控制社会信息,探究社群规模、社会信息与初始估值的差率(简称社会差异)对个体估计的影响。
研究发现,部分参与者没有受社会信息的影响。因此,首先,研究者使用贝叶斯统计方法逻辑回归模型,拟合了参与者改变初始估值的概率。主要考察了社会差异(定义为(S - G1)/G1)、社会距离(社会差异的绝对值)和社群规模这三个因素。其次,对于那些改变估值的参与者,进一步分析改变估值的程度(第二次估计与第一次估计的差距)。社会影响强度定义为a,拱北中学参与者再次估值的对数ln(G2)则为社会信息S的对数和初始估值的对数的加权平均(ln(G2) =a*ln(S) +(1 -a)ln(G1))。其中a= 0时,说明个体完全没有受到社会信息的影响;而当a= 1时,个体和社会信息完全一致。
2.2.2 社会影响规律:社会置换,社群规模
一方面,如图5c,我们发现社会信息越小于初始估值,社会影响权重越小,即当社会差异为负时,社会影响权重与社会差异为正比。但当社会差异为正时,社会差异对社会影响权重影响不大。另一方面,如图5d,社会影响权重随着社群规模扩大而增加。
图5.社会影响规则。实线:预测的平均值; 阴影面积:95%可信区间;圈:(a-b)的分组数据的均值和(c-d)的原始数据。
2.2.3 社会影响与聚合方法:估值分布,聚合方法的准确度
分享信息会改变独立估计的对数正态分布,特别是,由于新的聚合方法参数化是基于未受社会影响的个体独立估计,当个体彼此共享信息时,准确度可能会降低。
尽管最大似然估计方法在没有社会影响的情况下通常表现最好(图3),然而这一指标极易受到社会影响,尤其在对象数量较大时(图6)。相比之下青春出动,受社会影响时,与几何平均数和算术平均数相比,修正的平均值在不同的物体数量任务中都非常稳健(图6);没有社会影响时,修正的平均值与最大似然方法具有几乎相同的准确度。
图6.社会影响下聚合方法的稳健性。
(a-c)与几何平均数对比;(d-f)与算术平均数对比。浅灰色圆圈:不受社会影响;深灰色圆圈:受社会影响。对于数量为ln(J)= 4(a,d),ln(J)= 7(b,e)和ln(J)= 10(c,f)。圆圈表示1000次重复中的平均相对误差; 误差条图是标准错误的两倍。
3.结论与推广
3.1 文章要点:
误差来源、聚合方法与群体智慧
虽然群体的智慧已经在许多人类和非人类的情境中被证明,但其准确性的局限仍然没有得到足够的研究。本文中,通过分析两个主要误差来源,个人(估计偏差)和社会(信息共享),探究了群体的智慧如何、为什么以及何时可能失效。文章揭示了一些常用平均估值指标的局限性,并介绍了三种新方法,通过更好地理解这些错误来源,提高群体的智慧。
3.2 结论推广:
从数量估计到一般的估计任务
除了从数量估计任务得到的结论和建议之外,这些方法也可以应用于各种其他估计任务。个体估计偏差和社会影响是无处不在的,估计任务可归到容易受到类似偏差或社会规则影响的大类中。例如,许多估计任务可能呈对数正态分布,而其他可能呈正态分布。事实上,有证据表明,削弱估计偏差可能提高以下领域的估计准确度:概率,城市人口,电影的票房回报和工程失败率。
3.3 社会影响规律与社会置换:
与自身估值的差异,估计对象的数量级
此外,我们根据经验归纳的社会影响规律与一般社会影响模型相似,但未考虑社会差异的影响。这种非对称效应表明,相比低于自身估值的社会信息,个体会更受高于自身估值的社会信息影响。观察到变化系数随对象数量增加而增长,这可能表明一个人对自己估计的信心随着对象数量增加而下降,也许导致了社会差异的不对称效应。在其他估计领域,个体估计的置信水平与估计任务的数量级有类似的关系。结合社会距离的较弱负面影响,令人联想到“有限信心”观点的动态模型,个体倾向于重视与自身观点相似的社会信息。
图片来源:iStock
通过量化分析个体估计偏差和社会信息共享带来的集体偏见,新的聚合方法可以削弱这种偏差,在汇总观点时可能会产生显著的改进。这也可以应用于其他领域。
3.4 其他方法:“隐藏的专家”
其他方法也已被用于提高群体智慧的准确性。一种策略是寻找“隐藏的专家”,提高他们意见的权重。虽然这种方法在某些情况下有效,但在实验数据中没有找到存在隐藏专家的证据。对比忽视和使用社会信息的两类人群,他们估计值的分布没有显著差异(p= 0.938,用Welch的t-检验对数转换后的估计值),而且算术平均值、中位数和三种新的聚合方法在这两个群体当中都未显示出更高的准确度。此外,搜索隐藏的专家需要关于个人的额外信息(例如使用社会信息的倾向,过去的表现或对于自己估值的置信水平)。文章中的方法不需要任何关于每个人的附加信息,只需要关于总体人口统计趋势的信息(且可能只需较少的样本就能充分参数化这些趋势)。
3.5 聚合方法的改进与展望:
模拟个体影响和社会网络,一般化计算置信区间
这三种新方法也存在进一步改进的可能。当潜在的社会网络已知,或个体的权力/影响力存在差异时,模拟这些网络的社会影响规则可能促进对个体估值与集体估值的关系的理解。另外,聚合方法可以直接一般化计算置信区间,生成的估计范围以一定概率包括真实值。为了提高置信区间的准确性,我们在本文中也证明了样本大小等其他特征的重要性。
图片来源:iStock
总之,削弱估计偏差和社会影响可能是提高群体智慧的简单、普遍、高效的一种策略。
作者:杨清怡
审校:张洪、李周园
编辑:王怡蔺
一文读懂复杂网络与群体智慧
王伟嘉集智俱乐部
导语
在复杂网络中,林正宏究竟是什么使得群体同时具备了“愚蠢”与“智慧”的双重人格呢?游戏《信任的演化》(The Evolution of Trust)的姊妹篇《The Wisdom and/or Madness of Crowds》,为我们提供了研究人群的生动视角立道庭。
1.牛顿:我能计算天体运行轨道
却无法计算人性的疯狂
提起艾萨克·牛顿,每个人的心中必定会涌现出那个被苹果砸中而发现万有引力定律的少年形象,毫无疑问,牛顿是“聪明”的代名词。我们会理所应当地认为化工大唐 ,既然牛顿同学如此聪明,数学天赋远超旁人(微积分的共同发明者),那他在一向以高深数学技巧为工具的金融投资领域一定会如鱼得水,赚得盆满钵盈,成为人人追捧的投资教父。但我们印象中的牛顿好像并没有这样一个光辉的头衔,是什么阻止了他成为投资大鳄?
来源:网易 牛顿的“南海泡沫”
简而言之,1720年爆发的南海岸泡沫事件为牛顿同学的投资教父之路画上了句号。作为欧洲早期著名的“三大经济泡沫”之一,南海岸泡沫事件引发的全国性投机狂潮让牛顿同学损失了460万美元(以现价计),无数投资者损失惨重,甚至最终导致了政权更迭。
血本无归之后,牛顿仰天长叹:“我能计算出天体运行的轨道,但无法计算人性的疯狂。”
来源:“南海泡沫”的启示
南海岸泡沫事件是典型的由群体性疯狂导致的经济灾难,投机心理使得每个人都失去了理智,群体表现出难以控制的癫狂状态。历史上这样的现象,在机构甚至是整个民主国家中都时有发生,如果不及时干预,其后果往往是灾难性的。
2.如何从游戏视角切入群体人格?
但这些疯狂而愚蠢的行为,并不是我们所看到的人群行为特征的全部,“智慧”同样是群体行为的重要特征。抗震救灾时的群策群力、推进复杂工程时的集体公关无不体现着群体智慧的强大力量。
那么,究竟是什么使得群体同时具备了“愚蠢”与“智慧”的双重人格?现有的理论都不足以给出令人信服的解释,但是网络科学却可能为理解这一现象提供强有力的工具。作为一种日益兴起的科学领域,网络科学告诉我们,要想理解群体,我们的关注点不应局限于个人,人与人之间的联系才是重中之重。
游戏《The Wisdom and/or madness of crowds》为我们提供了研究人群“双重人格”的生动视角。这款游戏是此前流行的《信任的演化》的续篇。
游戏传送门:
https://ncase.me/crowds/
3.构建一个社交网络
对于人类而言,结交朋友在社交生活中不可或缺,通过语言交流、邮件、微信等通讯方式,我们可以与陌生的人成为朋友,建立联系。如果你交友甚广盛时表行,久而久之,你会发现这些联系数量庞大,十分复杂,像一张大网。这样的交友过程可以方便地用网络科学语言进行描述:
网络中的每个人都是一个节点,如果两个人是朋友关系,那么他们就建立联系,我们就用一条连边连接这两个节点。以此类推慕少请自重,当所有的联系都加入之后,我们就得到了一个社交网络。当然,如果与一个朋友失去了联系,我们也可以将与他的连边删去。
其实,我们与他人成为朋友、建立自己社交网络的目的,并不只是为了画出漂亮的网络可视化图片(推荐Gephi软件来创建一张你自己的社交网络图),而是希望周围的朋友能带给我们积极向上的影响。因此,很多实际问题我们都非常关心,比如,朋友中有多大的比例是酒鬼?很显然,如果你与一群酒鬼成为朋友,他们不是正在喝酒,就是准备去喝酒,耳濡目染,你成为一名酒鬼的可能性将急剧上升。
Gephi:https://gephi.org/
一个很简单的方法是直接统计你的朋友中酗酒者的人数,就可以得到你想要的酒鬼比例。下图是一个具体的例子,通过添加与删除连边,朋友中酒鬼的比例将会随之改变。
4.社交网络
可能会蒙蔽我们的眼睛
虽然上述的方法很简单,但是一个隐含的问题可能被我们忽略:在社交网络中,这样做真的准确吗?换句话说,通过上面的方法统计得出的酒鬼比例真的符合真实情况吗?
1991年的一项研究[1]表明,“几乎所有大学生都认为,他们大多数的朋友都是酒鬼”,这显然与我们的经验大相径庭。但是,是什么导致了这一与常理相悖的结论?为了找出答案,我们仍然从在社交网络中添加连边的简单操作开始。
开始时,网络中不含任何连边,所有人都刚刚进入一个新的生活环境,但这些人中有些人很特殊——嗜酒如命,不过这些酒鬼的数量并不多,只占总人数的33.33%。现在,我们开始为这些节点加上连边,人们开始建立朋友关系,但是,与之前不同,我们有一个目标,那就是要通过添加连边使得所有人的朋友中,酒鬼所占的比例不低于50%。
通过一些尝试,我们很快可以找到一种添加连边的方法(比如下图),这使得每个人的朋友中,酒鬼的比例都占了一半(交友不慎的典型案例)。如果你自己身处这个社交网络中,那么随便询问一个朋友,他都会说“我真倒霉,身边的朋友大多数都是酒鬼”,你是不是会认为这个社交网络中真的有一半的人是酒鬼?如果你真的这样想,那么我们的目的达到了:你已经开始相信,酗酒文化已经发展到了令人发指的程度。
我们刚刚利用建立连边的方式制造了大多数人都是酒鬼的假象,这种认知上的偏差被研究人员称为“多数错觉”(Majority Illusion,[2]),是由个体在缺少全局信息的情况下,通过社交网络的有限信息进行决策时导致的,这也解释了为什么很多人认为他们自己的政治观点是大多数人的共识。社交网络的网络结构在其中起到了关键作用(友谊悖论Friendship paradox是另一个典型的例子[3])。
5.“信息级联”:
信息在网络中的快速传播
社交网络的特殊结构导致了“酒鬼假象”的出现,而现实生活中,如果我们的同学大多数都是酒鬼,那么我们也很有可能酗酒,这一现象反映了社交网络上另一个重要的现象——信息的传播。实际上火玩网,当我们从某些朋友那里听到某个“重磅消息”时,我们很有可能把这个消息告诉其他朋友。这一行为表明,人们并不只是被动地接收他人的思想和行为影响,也会积极地传播它们。那么,网络科学是如何描述“传播”行为的呢?
以谣言的传播为例,在社交网络中,谣言的传播是以谣言源头为开始,沿着连边对其相邻节点的“感染”过程,这里的感染是指该节点接收到了谣言,并且作为新的源头将谣言继续传递。但实际上,传播(contagion)是一个中性词,大量统计数据表明,抽烟、幸福指数、投票倾向甚至自杀[4]以及大规模枪击[5]等都具有“传播性”。
我们将类似谣言传播的消息的疯狂传播过程称为“信息级联”,1720年的南海岸泡沫以及2008年世界经济危机都属于这样的级联过程。
6.“复杂传播”:
群体“愚蠢”与“智慧”的来源
但仔细思考后,上述的谣言传播过程可能与实际情况不符,例如,如果“重磅消息”只来源你的一个朋友,而其他朋友却对此并不知情,那么这条消息对你的影响可能很小,你把这条消息继续传播的可能性同样不高。换言之,人们通常在多次接触消息源之后才会被“感染”,成为新的消息源。网络科学中,这一传播特征被称为“复杂传播”。
仍然以谣言的传播为例,在其从消息源沿着连边传播的基本行为不变的前提下,我们加入“传播阈值”的限制,即只有当某一结点的所有相邻节点中,被感染的节点比例不低于50%时,该节点才能被感染。直观来说,只有当朋友中超过一半的人都跟你讲了这一条谣言,你才会接收这条谣言并成为传播者。加入这条规则后林树哲,我们会发现,对于下图的社交网络,谣言不能感染网络中的所有人,对于那些朋友中只有少数感染者的人来说,他们并不会接收谣言并成为传播者。但是,如果适当添加连边,提高朋友中感染者的比例,谣言就可以散布到网络中的所有个体。“传播阈值”是“复杂传播”与病毒扩散式的简单传播的主要区别,较好的反映了个体在感知谣言时的行为特征。
同样的,通过“复杂传播”群体也可表现出“智慧”的属性,比如志愿行为的传播,我们可以根据实证研究对信息的“传播阈值”进行设置,从而给出特定消息或行为的传播机制。
游戏进行到现在,我们已经了解了信息如何在社交网络上“复杂传播”,尽管有“传播阈值”的限制,但是,好像总可以通过添加连边的数量使得邻居节点中的“感染者”比例超过“传播阈值”,使信息传递到网络中的每个节点。那么,只要不断增加连边就一定可以使“复杂”或者“简单”的信息扩散到整个网络吗?
事实上,如果我们仔细思考,会很快发现,对于病毒式的简单传播而言,只要网络中不存在与其他任何节点都无连边的孤立点(我们称这样的网络是连通的),那么信息一定会扩散到网络中的每一个节点,连边的数量只会影响信息传播的速度。但对于“复杂传播”则是完全不同的情况。
由于“传播阈值”的存在,尽管在节点之间添加连边可以增加周围传播者的数量,但如果连边过多,却可能稀释传播者的数量比例,甚至低于“传播阈值”,阻断信息的进一步传播。因此,我们可以看到,对于简单传播而言,增加连边有助于信息的传播,但对于“复杂传播”而言,增加连边数量却可能阻断信息的传播。
7.设计智慧:
“内聚”与“桥接”的平衡
我们为什么要关注信息在社交网络中的传播能力呢?对于像谣言那样的负面信息,我们自然希望它的传播能力很小,限制在有限的小范围内,使其负面效应尽可能小,避免“群体愚蠢”的出现;而对于积极的正面信息,如志愿行为的传播,则需要鼓励与提倡,从而推动“群体智慧”。而通过之前的分析,我们可以看到,网络结构的设计对于信息的传播具有决定性作用,通过改变连边的数量以及节点的连接方式就能够改变信息传播的能力,那么,如何才能设计一个具有“群体智慧”的社交网络呢?我们从历史上的一个悲剧来切入。
1986年1月28日,美国“挑战者号”航天飞机起飞仅73秒即在空中解体,7名航天员全部遇难,令人震惊的是,事故调查表明,NASA的管理层事前已经知道“挑战者号”存在故障,却未曾对此提出改进意见;而发射当天,管理层忽视了工程师发出的低温警告。调查委员会指出,正是NASA的组织文化与决策过程的缺陷与错误成了导致这次事件的重要原因[6]。
让我们用信息的“复杂传播”来对NASA管理层的“愚蠢”行为做一个直观的解释。当时的管理层之所以忽视工程师的警告,是因为他们身居高位,彼此之间的联系太过紧密,直观来说,管理层人员组成的社交网络中的连边数量过大,使得外部信息在向网络传播时无法超过“传播阈值”,管理层“自然而然”地忽视了工程师的警告。
通过之前的讨论与实践,具有“群体智慧”的社交网络在结构上具有某些共同点,我们这里归纳为两方面:“内聚”与“桥接”的合理分配。
“内聚”意味着连边的数量能够保证信息在人数相对较少的组内进行扩散,又不会出现连边数量过大的情况,导致外部信息无法传入。这时网络形成了内外通畅的良好结构,信息可以顺利传入、在内部扩散。
在完成小组内部的网络结构后,我们需要进一步考虑不同小组之间的连边设计,这就是“桥接”的含义。“桥接”能够打破小组由于与外界孤立而形成的回声效应。同样的,桥接也存在一个合理的连边数量,使得信息在由多个小组组成的社交网络中畅通地传播。
综合这两个设计原则,我们就能够设计出能够让积极信息顺利传播的社交网络,实现“群体智慧”。
游戏进行到现在,你已经具备了设计合理结构社交网络的能力,“内聚”与“桥接”的合理调配将使社交网络表现出强大“群体智慧”。网络科学中,将具有合理“内聚”与“桥接”连边数量的网络称为“小世界网络”。实证研究表明,神经元的连接、集体创造力的培养、问题的解决等均可由小世界网络描述,可能正是小世界网络内在结构的和谐让我们看到了“群体智慧”的光芒。
8.小结:
在群体中担负起自己的责任
回到我们的主题,网络科学告诉我们,理解人群“愚蠢”与“智慧”的双重人格需要从联系的角度入手。我们首先要做的,是删繁就简,隐去每个人之间相貌与性格的差异高嘉晗,将参与社交行为的人抽象为一个个节点,根据他们之间是否存在朋友关系建立连边,从而得到结构明确的社交网络。信息可以通过“级联”的方式网络中传播,但并不是所有信息都会像病毒那样传播,志愿行动、投票等信息的传播更为“复杂”,对于网络的结构具有很高的要求。
为了让这些需要“复杂传播”的信息尽可能多的传播给社交网络中的人,我们需要在网络结构的设计中找到一个平衡点,使得每个小组内部互联而不封闭53719,小组之间互相开放,也就是“内聚”与“桥接”的合理权衡。我们将满足这一设计准则的网络称为“小世界网络”,其广泛存在于神经元连接、问题的解决等群体协作的形式中,为“群体智慧”的出现奠定了基础。
从让牛顿爵士损失惨重的南海岸泡沫到 NASA 的荒唐决策,群体的“愚蠢”似乎不应归咎于个人,社交网络的结构才是罪魁祸首。但是,这并不意味着个人的责任不再重要,因为我们的交友以及对信息的判断决定了社交网络是“智慧”的还是“愚蠢的”。对于每个人来说,对来自朋友的信息多一分理性的判断,不盲目传播那些未经权威证实或者经不起推敲的消息;适当调整我们的交友原则,与怀有不同价值观、文化背景甚至政治立场的人建立联系,而不是只与“志同道合”者成为朋友。当我们有意识地做出改变,我们会发现许多有趣的人与事,我们对于周围世界的认识会渐渐丰富,获取的信息也将变得积极而有意义。
尽管创建一个具有“智慧”的群体需要相当的精力,但是当群体内外通畅、沟通能够无障碍地进行时,所有付出的努力都是有价值的,因为当一个群体具有智慧时,受益的将是属于这个群体的每一个人。
注释:
[1] Biases in the perception of drinking norms among college students.J S Baer, A Stacy, and M Larimer Journal of Studies on Alcohol 1991 52:6, 580-586
[2] Lerman K, Yan X, Wu X-Z (2016) The "Majority Illusion" in Social Networks. PLoS ONE 11(2): e0147617. https://doi.org/10.1371/journal.pone.0147617
[3] https://en.wikipedia.org/wiki/Friendship_paradox
[4] Suicide contagion and the reporting of suicide: recommendations from a national workshop. United States Department of Health and Human Services May 1994MMWR. Recommendations and reports: Morbidity and mortality weekly report. Recommendations and reports / Centers for Disease Control 43(RR-6):9-17
[5] Towers S, Gomez-Lievano A, Khan M, Mubayi A, Castillo-Chavez C (2015) Contagion in Mass Killings and School Shootings. PLoS ONE 10(7): e0117259. https://doi.org/10.1371/journal.pone.0117259
[6]https://en.wikipedia.org/wiki/Space_Shuttle_Challenger_disaster
作者:王伟嘉
审校:谷伟伟
编辑:王怡蔺
游戏地址:https://ncase.me/crowds/