Shammunity

Powered by 🌱Roam Garden

6. 理清复杂关系

6.1 非线性因果关系

简单的问题往往遵循直接的因果关系。当病人有一系列与流感密切相关的症状时,医生可能会从可观察到的变量中推断出有一个不可见的变量——流感病毒。治疗这个潜在的变量,症状就会消失。

Scott Alexander 观察到,他的精神病学同行同样试图将一组相关症状归因于一个潜在变量,例如抑郁症。【6】然而,抑郁症引起的症状-例如睡眠障碍、疲劳、内疚——也会对彼此和紊乱本身产生因果影响。这种复杂的关系网,可能包括反馈回路,并不遵循线性因果关系的路径。对于这种性质的复杂问题,节点网络是一个更精确的模型:

Nuijten、Deserno、Cramer 和 Borsboom 建立的一个抑郁症(MD)和广泛性焦虑症(GAD)模型。【7】这些疾病大致映射到一系列症状上,这些症状经常在一起发生并相互加强,但在这些症状之间没有清晰的“亮线”。

即使从表面价值来看,节点网络也为解决问题提供了一种直观的帮助——鸟瞰各种元素之间的联系。这可能有助于识别不同形态或群集,这些形态或群集可能是违反直觉的,或者当研究微观结构时很难看到整体面貌 。

6.2 贝叶斯推理

将贝叶斯推理应用于知识图,可使其成为概率估算、假设评测和决策制定的强大工具。贝叶斯定理是一个概率定律,它告诉我们,当学习一个新的事实或获得新的证据时,我们应该在多大程度上改变我们对某事的看法。该定理在下列方程式中陈述:

P(AB)=P(BA)P(A)P(B)P(A|B) = {P(B|A) P(A) \over P(B)}

其中A是关注的命题,B是观察到的证据, P(A) 和 P(B) 是先验概率,P(A|B) 是 A 的后验概率。

假设一个医生有一个病人,因为他属于一个高危人群,所以他想知道携带一种潜在病毒的概率, 这是等式左边的“关注命题”。先前的数据表明,总人口中有 4% 是病毒携带者,因此 P(A)=0.04P(A) = 0.04 。B是观察到的证据, 即 32% 的总人口是高危人群,P(B)=0.32P(B) = 0.32。医生知道,在携带该病毒的患者中,80% 属于高危人群:BA=0.8B | A=0.8.

医生应用了贝叶斯定理:

P(AB)=(0.80.04)/0.32P(A|B) = (0.8 * 0.04)/0.32

P(AB)=0.1P(A|B) = 0.1

她的病人只有十分之一的机会成为病毒携带者,这可能低于常人的预期,因为几乎所有的携带者都是高危人群。

虽然这是一个简单的计算,但贝叶斯推理的优势在于可以将看似无法解决的问题分解成小块。即使没有可用的数据,连续的多层估算仍然可以对各种结果的置信水平提供有益的改进。通过将此框架加入到节点之间定义的关系中,网络中任何一点的权重的修改将自动更新到整个知识图中。

贝叶斯概率也为决策制定提供了一个框架。通过评估各种选择的成本和取舍,用户可以计算出哪条路径提供了最高的期望值。同样,即使权重只是个人喜好的简单估计,决策的质量也可以通过多层的正反方论据来改进。评估矩阵允许我们将大量信息集成到最终决策中,而不是默认使用某种简单的推断法。

7. 为意外发现进行优化

正如人类无法随意生成随机数一样,让我们有意识地生成随机想法也很困难 ——以至于我们常常主动尝试“以不同的方式思考”, 但这似乎只会进一步加深现有思维模式的固化。大脑必须面对新的刺激,才能重新组织其感知能力,而不是试图粗暴地强行产生创造力。暴露在一定数量的随机“噪音” (毒品、梦境、冥想、塔罗牌阅读、错误)会使思想脱离常理的束缚,进入全新的思维空间。通常,这些洞察发生在两个或多个看似不相关的领域、概念或形态的交界处。

Roam 知识图的相互联系可不断地为意外发现创造机会。 网络中的每个节点都可以在多个图表显示与查看,用户可以查看相关的想法,上下扫描垂直层次结构,检查附近的节点群集以及观察知识图的形态。

Roam 的搜索功能可以根据用户的需要进行校准,以包含尽可能多或尽可能少的“噪音”。在寻找特定的段落或注释时,搜索设置可以足够窄,以准确地找到用户的想法。然而,它也可以扩大到“钓鱼之旅”的范围,目的是使各种想法浮出水面。一些搜索结果将包含用户可能已忘记的注释,一些可能是噪音,而另一些则会激发用户甚至不知道自己在寻找的想法。

来自不同领域思想的交叉融合可为个人和社会带来唾手可得的效益。而成为某个领域一名专家所需的时间和精力投入则很快会进入收益递减。相比之下,积累一系列业余知识或技能的“才华”反而可以捕捉到那些局限在更窄关注点专家们所洞察不到机会。

高度专业化的知识对于开辟新的领域仍然至关重要。然而,面对日益复杂的问题,跨学科的研究方法对科学家、技术专家和决策者也变得愈发必要。

8. 协同问题解决

虽然 Roam 的单人使用有其自身的优点,但最终目标是创建一个协作研究和学习的平台。现有机制常常受到必要共识假设的约束,而知识图库的灵活性允许一种更加多元化的方法,能够在不诉诸专制或民主的情况下,权衡相互冲突的观点,将信号与噪音分离。

8.1 在噪音中寻找讯号

随着信息频率的增加,世界变得越来越嘈杂。 如第7章所述,在特定情况下,故意暴露于噪音是一种有用的策略,但在其他时候会造成沟通中的含混。【8】鉴于我们有把故事和解释强加于随机性的倾向(即叙事谬误),将真正的信号与噪声区分开来变得越来越困难。

假设一个趋势的年化信噪比为 1:1(50% 的数据是有意义的,50% 是随机的)。如果我们每天观察相同的数据,则比例变化为 95% 的噪声,5%的信号。如果每小时观察一次数据(就像新闻记着和市场狂热追踪者那样),它就会变成 99.5% 随机-也就是说,噪音是信号的200倍。【9】

负责解释数据的机构包括媒体,学术界和立法机关。 这些机构中的某些人可能故意掩盖真相,如“假新闻”,p-hacking和politicking。 尽管主动的恶意行为是例外,但即使是最好的记者,研究人员和分析人员也不能幸免被随机性所愚弄。

因此,对大多数人来说,从噪声中分离信号的问题涉及到寻找可靠和准确的辅助信息源。这项困难的任务经常被封闭的科学期刊和搜索引擎算法所阻碍,这些算法越来越被精通搜索引擎优化的内容营销人员操纵。

8.2 信息冗余

浏览海量信息会产生大量冗余。 大多数人将精力浪费在已经解决了一百万次的问题上。 那些解决未解决问题的人们经常在信息孤岛上,而没有意识到彼此的存在。任何给定拼图的所有碎片可能都存在,但没有一个个体或群体持有全部。在无穷无尽的论坛、评论区、网页和书籍中,车轮被一遍又一遍地重新发明 ,信息突然出现,又很快消失得无影无踪。

8.3 共识

今天,几乎每种媒体都把所传播的认知当作真理来呈现;假设有默认的共识,且不可分割。维基百科是互联网时代最伟大的奇迹之一,但它同时犯了这两个错误。对于任何给定的语言,任何主题都只能有一篇文章,页面之间的唯一连接是通过链接,而没有文章是在另一篇文章的基础上构建的。

相比之下,我们来看一下Github:库是在其他库上构建的,功能是从其他功能上构建的。开发人员致力于开发可以被其他人拿来做更棒工具的工具。大多数现代互联网都是建立在开源技术之上的,如果程序员只能遵循旧的协议进行智能协作,这是不可持续的。

许多问题可以通过编写代码来解决,但是自然语言仍然是我们确认哪些问题值得解决的方式。 自然语言是我们相互解释世界并交流现实模型的方式。它是教育的语言,也是决策的语言。自然语言需要一个跟管理代码的工具链一样好的协作工具链。

8.4 反对独裁;反对民主

必要共识的问题是可以由个人或团体根据他们自己的信任网络所提供的数据,并依其所得出的推论图来解决。然而,协作仍然需要一种机制来评估哪些想法是最好的。就像个人给自己的预测和决定赋予权重一样,团队必须能够对任何给定的想法、前提或证据的可信性进行“投票”。如何校验这些集体权重,有多种选择,下面简要介绍其中一些。

a) 群体智慧

一群人可以做出比任何一个个人都更好的某些决定和预测:伟大的统计学家弗朗西斯·高尔顿惊讶地发现,在一个乡村集市上,800 人猜测一头牛的均重仅比1198磅的正确数字低一磅。

在其他情况下,群体的意见与客观现实关系不大。从定义上说,多数人把控的铁腕政权将打消任何不受欢迎的立场,不管它是否正确。通常,可能还需要特定领域的知识;例如,没有学习过自由意志的人只会通过投票选择相容主义、硬决定论或自由主义来增加噪音。

简单的人气比拼并不总是能让我们更接近事实,但它是有用的,因为它告诉我们什么是我们相信的。这些数据可已按人口统计数据来分解,以展示不同的群体如何看待现实,并可能提醒人们注意到其自身群体内的偏见。

b) 可信度评分

对冲基金经理雷达里奥(Ray Dalio)在桥水基金(Bridgewater Associates)开创了一个决策系统,相较民主制度这更像一个智者治国的制度:与那些可信度得分较低的人相比,那些反复证明自己对特定专题或特性有把握的“可信”人的观点更具分量。没有什么可以阻止达里奥的观点被他最年轻的员工推翻,只要员工始终可持续证明比达里奥更正确。在Roam中实现类似的系统将需要跟踪绩效的能力,比如用户对知识图贡献了多少被广泛支持的原创内容,或者他们的预测有多么精准。

c) 预测市场

当人们屈服于同伴的压力和其他偏见,没有足够的专业知识或故意做出错误的预测时,“群体的智慧”最终可能是非常错误的

预测市场背后的洞见是,可以利用市场的力量激励参与者从任何错误中获利。只要有人认为某个共识是错误的,他们就可以把资金押在该共识上,并把概率推回到一个更明智的立场。内幕信息不仅被允许,而且受到欢迎。 通过这种方式,大量的信息可以被合成为一个不断更新的数据点,且其通常非常准确。

监管问题抑制了预测市场的增长与扩大,可能的解决方法包括非法定代币(non-fiat token)或声誉挂钩积分系统。

9. 结论

今天的人类知识工程,是一个浩瀚的信息和思想的海洋,其中很多是不准确的,有些是恶意的,其最佳资源或有看门人限制,或几乎不可能找到。信息量呈指数级增长,如果能够解决潜在的协作问题,这将带来巨大的机会。

显然,我们需要一种跟以往本质上不同的方法。Roam 对人类知识的愿景是一种集体的、开源的智能,不断地重新排列、迭代和进化以追求真理。我们每个人都将成为这个集体智能中的一个节点,建立联系并创建网络,分享每个人所能提供的最好的东西,在改善他人的同时也在改善自己,推进人类的前进。

关于 Roam

Roam 由 Conor White Sullivan 和 Joshua Brown 创立。九年多以来,Conor 一直致力于集体智能工具的开发,创建了在线小镇 common Localocracy(2011年被AOL收购),并在收购之后领导了《赫芬顿邮报》的研发工作。 Conor 和 Josh 在免学费的编码大学 42.us.org 见面,在为期一个月的申请考试期间,Josh 在首批1000名进入美国项目的学员中名列前五。 该白皮书由商业记者 Richard Meadows 共同撰写,他对早期原型的试用使他成为 Roam 的第一位投资者。

联系方式:cwhitesullivan@gmail.com

注释和参考文献:

现在每天至少产生2.5万亿字节的信息,这与2002年全年产生的信息量差不多。

科学美国人: New Estimate Boosts the Human Brain's Memory Capacity 10-Fold.

微电子学的先驱卡弗·米德(Carver Mead)创造了摩尔定律一词,他在1990年正确地预测到,如今的计算机在单个指令中的能量消耗要比大脑在突触激活中的能量高一千万倍。

本示例改编自 《the Less Wrong sequence 37 Ways Words Can be Wrong》

莫特和贝利(Motte-and-bailey)指的是争论一个容易辩护的、通常是常识性的陈述(Motte),以避免批评人士提出一个难以辩护的、更有争议的陈述(bailey)。 该术语由斯科特·亚历山大(Scott Alexander)推广,并在《All in All,Another Brick in the Motte》中进行了解释。

Slate Star Codex: 精神障碍作为网络。(Mental disorders as networks).

Michèle B. Nuijten, Marie K. Deserno, Angélique O. J. Cramer, Denny Borsboom: 精神病理学的网络方法的介绍和概述 (An introduction and overview of a network approach to psychopathology)

正如卡尔·萨根(Carl Sagan)所观察的那样,虽然每天电视节目中播放的数据比历史上所有文字作品的总和还要多,“但并非所有的比特都具有同等的价值”。

此示例来自塔勒布 (Nassim Taleb) 的《反脆弱》(Antifragile)。

进一步阅读

Daniel Kahneman, Thinking, Fast and Slow

Robin Hanson, Could Gambling Save Science?

H Van Dyke Paranuk, Don’t Link Me In: Set Based Hypermedia for Taxonomic Reasoning

©:: Michael Nielsen, Reinventing Discovery: The New Era of Networked Science

Richards J Heuer The Psychology of Intelligence Analysis

关于这篇文章

我们在2017/2018年冬季撰写了此白皮书,尽管该白皮书仍反映了我们对该工具的大部分愿景,但其中一些功能-特别是贝叶斯推理,参数分析和预测市场的部分,对于我们想要协助的研究人员和决策者来说,我们发现其优先级比想象的要低得多,并且也增加了对大部分用户使用起来于复杂的风险。 如果您有兴趣使用 Roam 进行更正式的定量推理或建立正式的信任网络模型,或者对本文中的想法感到兴奋,而您目前还没有在 Roam 内看到的解决方法,请与我们联系。

Referenced in