当前位置：

社区首页

电脑数码

软件应用

服务软件

文章详情

思维制高点：真正的高手，都是贝叶斯主义者！（二）

接上文继续

六、别太完美，降低自己被证伪的概率

贝叶斯推理和波普尔的证伪主义可能看似截然不同，但是它们其实在某种程度上是相似的。首先，让我们简单地回顾一下这两种思想：

1、贝叶斯推理： 在这个框架中，我们根据新的证据不断地更新我们的信念。我们不断地在我们的模型或者理论中添加新的信息，并基于这些信息调整我们的预测。最关键的是，我们不会彻底抛弃旧的信念，但是我们会根据新的证据进行调整。

2、波普尔的证伪主义： 在这个框架中，我们设立假设，并试图找到证据来反驳这个假设。如果我们找到了这样的证据，我们就会彻底放弃这个假设。如果我们没有找到这样的证据，我们会继续保持这个假设，但是我们仍然要持续寻找可能反驳这个假设的证据。

这两种思想的一个共同点是，它们都强调了试错过程和持续学习的重要性： 在贝叶斯推理中，我们通过观察和学习来改进我们的预测； 在波普尔的证伪主义中，我们通过试图证伪我们的假设来改进我们的理论。 然而，这两种思想的一个关键区别是，贝叶斯推理允许我们结合新旧信息，而证伪主义则更倾向于抛弃被证伪的理论。换句话说，贝叶斯推理倾向于逐步改进我们的模型，而证伪主义倾向于寻找突破性的改变。这两种方法在实际应用中，往往会结合使用。比如在机器学习中，我们会使用贝叶斯方法来更新我们对模型参数的信念。但同时，我们也会尝试找到那些能够证伪我们当前最优模型的数据，这样可以帮助我们发现更好的模型。

下面用一个简化版的垃圾邮件过滤贝叶斯模型示范。

事实上，识别邮件是垃圾邮件，就是证伪“该邮件是正常邮件”。为了简单起见，我们假设有两个单词“赚钱”和“优惠”，我们想知道一封包含这两个词的邮件是否是垃圾邮件。

我们的训练数据如下： 1、有100封邮件是垃圾邮件，其中“赚钱”这个词出现在90封邮件中，“优惠”这个词出现在60封邮件中。 2、有100封邮件是正常邮件，其中“赚钱”这个词出现在10封邮件中，“优惠”这个词出现在30封邮件中。我们首先计算单词“赚钱”和“优惠”在垃圾邮件和正常邮件中的概率： 1、P(赚钱|垃圾邮件) = 90/100 = 0.9 2、P(优惠|垃圾邮件) = 60/100 = 0.6 3、P(赚钱|正常邮件) = 10/100 = 0.1 4、P(优惠|正常邮件) = 30/100 = 0.3 另外，我们假设垃圾邮件和正常邮件的先验概率是相同的，都是0.5，因此： P(垃圾邮件) = P(正常邮件) = 0.5现在，我们使用贝叶斯公式来计算一封包含"赚钱"和"优惠"两个词的邮件是垃圾邮件的概率：P(垃圾邮件|赚钱, 优惠) = P(赚钱, 优惠|垃圾邮件) P(垃圾邮件) / P(赚钱, 优惠) 我们简单地假设"赚钱"和"优惠"是独立的，因此： P(赚钱, 优惠|垃圾邮件) = P(赚钱|垃圾邮件) P(优惠|垃圾邮件) = 0.9 0.6 = 0.54 P(赚钱, 优惠|正常邮件) = P(赚钱|正常邮件) P(优惠|正常邮件) = 0.1 0.3 = 0.03 P(赚钱, 优惠) = P(赚钱, 优惠|垃圾邮件) P(垃圾邮件) + P(赚钱, 优惠|正常邮件) P(正常邮件) = 0.54 0.5 + 0.03 0.5 = 0.285 代入贝叶斯公式，我们得到： P(垃圾邮件|赚钱, 优惠) = P(赚钱, 优惠|垃圾邮件) P(垃圾邮件) / P(赚钱, 优惠) = 0.54 * 0.5 / 0.285 = 0.95 这个结果表明，一封包含“赚钱”和“优惠”两个词的邮件，有95%的概率是垃圾邮件。 “赚钱”和“优惠”，证伪了“该邮件是一封正常邮件”。

但是，根据上面的计算，还是有5%的概率不是垃圾邮件。如果非常重要的邮件因此被归为垃圾邮件，后果是否很严重？

这正是贝叶斯垃圾邮件过滤器面临的一个常见问题：误报。

解决这个问题的一种方法，是调整过滤器的阈值。在上面的例子中，我们可以设定一个规则，例如只有当一封邮件被判定为垃圾邮件的概率超过99%时，我们才将其归为垃圾邮件。这样可以显著降低误报的概率，但代价是可能会有更多的垃圾邮件漏过过滤器。

另一种方法是使用更复杂的模型，例如包含更多特征的模型，或者使用深度学习等方法。这些模型可能会提供更好的性能，但同时也会更复杂，需要更多的计算资源。在如上贝叶斯公式的计算中，使用了一些证伪的策略。更大的一个挑战，我将在第九节探讨。

一个贝叶斯主义者非常要注意的一个“坑”是： 当你有一个先验概率的时候，你继续获取信息，极可能会主动选择那些对你的观念（先验概率）有利的，自动屏蔽不利的。 如此一来，贝叶斯公式就完全失效了。‍‍ 通过贝叶斯公式，我们可以看到证伪或否定证据的重要性。批判性思维和证伪思维是科学研究的核心，也是保持思维开放、防止陷入偏见和过度确定的重要工具。

对于高手而言，证实和证伪同样重要。 只有如此，才能形成“可纠错的反馈闭环”。如上讨论给我们的启发是：

1、降低自己被证伪的风险，不要追求完美；

2、少点儿人设，少点儿标签，否则更易被证伪，装逼被雷劈；

3、阴谋论绝大多数都是假的，因为有太多假设，太容易被证伪。

七、成为学习机器，在适应中快速进化

贝叶斯公式的原理和哲学与适应性和进化理性有深度的关联。我们可以从以下几个方面来进行理解：

1、学习和适应性： 贝叶斯公式是基于新的数据更新我们的观念和信念，这种动态调整和学习的过程与生物的适应性有很强的相似性。生物在环境中通过进化来适应环境，而贝叶斯公式则提供了一种在不断变化的数据环境中更新理解和决策的方式。

2、不确定性和进化理性： 贝叶斯方法是一种处理不确定性的方法，它接受并积极地使用不确定性，而不是尝试消除它。这种对不确定性的认识与进化理性的概念相吻合。进化理性是一种认识到我们的决策可能并不总是理性的，但是在进化的过程中，它们为我们的祖先提供了生存的优势。在这个意义上，即使面临不确定性，贝叶斯方法也能够提供最优或至少是足够好的决策。

3、动态更新和适应环境： 生物在自然界中要生存，需要根据环境变化做出适应性变化，而贝叶斯公式则提供了一种思维模式，让我们能够根据新的信息动态更新我们的观点和决策，以最好的方式适应我们所在的环境。

4、淘汰错误的假设： 贝叶斯公式中，一种假设（或模型）的概率会根据观察到的数据进行更新。如果一个假设持续得到的数据支持较少，它的概率就会变小，这就像自然选择过程中适应度较低的物种被淘汰一样。这种思想与进化论中的"适者生存"原则相一致。综上所述，贝叶斯公式的原理和哲学与适应性和进化理性之间存在紧密的联系，它们都强调了对新信息的接收、动态更新和在不确定性中做出最优决策的重要性。

一个高手，是贝叶斯主义的学习机器。 这里的原理，与第三条策略有类似之处。

概括而言，作为学习机器的高手有如下特征：

1、你要有自己的机器。

我经常批评“知识集邮者”，他们只是收集知识。高手有自己的知识花园，有自己的实践系统，有某个细分领域之内的基于数据、经验和专业的滚雪球人生，而非掰苞米人生。

2、你的机器必须可证伪、可纠错。

3、你的机器每天都比之前聪明一点点。

八、探索未知 & 利用已知，在攻和守之间进行权衡

在贝叶斯决策过程中，需要在探索未知和利用已知之间进行权衡。

多臂赌博机问题，是一个典型的决策理论问题。这个名字来自赌场里的老虎机，也叫做“一臂赌博机”，因为它有一个“手臂”，你拉下这个手臂就可以开始游戏。在这个问题中，你面前有n台赌博机，每台赌博机的赢钱概率都不同，但你不知道每台机器的具体赢钱概率。你的目标是： 通过一定次数的尝试，找出赢钱概率最高的那台机器，然后将剩下的押注全部放在这台机器上，以此最大化收益。

这个问题中的挑战在于找到一个合适的策略，这个策略要在探索（尝试新的机器以了解它们的赢钱概率）和利用（利用已知的信息，押注赢钱概率高的机器）之间找到平衡。贝叶斯思维在这个问题中特别有用。因为每次你尝试一个机器，你就获取了一些新的信息，这个信息可以用来更新你对这台机器赢钱概率的信念。通过不断地更新你的信念，并使用这个信念来指导你的决策，你就能找到一个较好的探索和利用的平衡，从而最大化你的收益。举个简单的例子：假设你面前有两台赌博机，你先试了第一台几次，发现赢钱的概率不高，然后你就转向第二台机器。第二台机器的前几次试玩，你都赢了，于是你就开始对这台机器有了信心，决定将更多的押注放在这台机器上。 但同时，你还会保留一些押注尝试第一台机器，以防万一它的赢钱概率有所改变。 这就是在多臂赌博机问题中利用贝叶斯思维的一个简单例子。

多臂赌博机问题其实是生活中“探索与开发（exploitation）”权衡的一个模型。这在我们的决策制定，选择策略以及资源分配上都有重要的启示。

1、持续学习： 贝叶斯思维鼓励我们积累经验，并根据新信息更新我们的认知。这意味着我们应该不断尝试新的方法，技能和机会，以便获取更多的信息，提高我们做出正确决策的概率。

2、决策平衡： 在生活、工作或者投资等多个领域，我们常常需要在已知的有限资源和未知的可能性之间做出权衡。例如，你是应该留在现在的工作，还是去尝试一份看起来有更多机会的新工作？是应该投资已经稳定盈利的公司，还是冒险投资一个有巨大增长潜力的创业公司？这都是需要权衡探索与开发的问题。

3、风险管理： 多臂赌博机模型还提示我们不能完全忽视任何一个可能的选择，即使它们现在看起来不如其他的选择。这种思维方式有助于我们管理风险，因为我们始终保留了一些资源来对可能性进行探索。

4、灵活适应： 贝叶斯思维也教导我们，当环境变化时，我们需要更新我们的预期和决策。这是一种灵活的思维方式，有助于我们在不断变化的世界中保持适应性。所以说，多臂赌博机问题并不仅仅关于赌博，更是一种生活哲学和决策制定策略。概括而言，我们需要一个攻守兼备的灵活人生。 我们应有一些自由探索，一些随机漫步，一些闲暇时光。

九、理解贝叶斯的局限，小心应对黑天鹅事件当“贝叶斯”遇见“黑天鹅”，会发生什么？

贝叶斯推理是根据新的证据更新信念，而不是推翻旧有的信念。但是，如果旧有的信念是全世界的天鹅都是白的，这时候观察到一只天鹅是黑色的，那么我们难道不应该彻底推翻所有的天鹅都是白的这一信念吗？你也许可以说，贝叶斯主义告诉我们：你看到一只黑天鹅后，贝叶斯推理将你原先的信念“所有的天鹅都是白的”，调整为“天鹅可以是白的，也可以是黑的”，或“大多数天鹅是白色的，但也有一些天鹅是黑色的”。 因此，从这个角度来看，你是在用新的证据来调整，而不是完全放弃你的旧信念。 然而，特定的信念（如“所有的天鹅都是白的”），可以在遇到反例时被彻底推翻。

如果我们的决策，我们的下注，建立在类似于“所有的天鹅都是白的”这类信念之上，那么新信息可能就不只是“更新原有信念”，而是彻底摧毁原有信念了。这就是为什么在科学实践中，证伪主义的观点（即，我们应该尝试证伪我们的理论）是非常重要的。所以芒格说：假如你不能比反对者更高明地证伪你的某个观点，你就不配拥有那个观点。

由此，我们可以看到，贝叶斯理论虽然强大且实用，但也有其局限性和缺点：

1、依赖于先验知识： 贝叶斯理论的一个主要缺点是它依赖于先验知识。在许多情况下，这些先验信息可能不准确或者难以获得。 例如，一位投资者可能基于错误的信息，或者对市场的错误理解，形成了一个错误的先验信念，这可能导致他们的投资决策出错。

2、过于理想化的假设： 贝叶斯方法往往假设各个特征是独立的，这在现实中往往不成立。例如，当我们在评估一家公司的股票时，我们可能会考虑这家公司的许多特征，如：财务健康状况、市场定位、管理团队等。这些特征之间可能存在着复杂的相互影响关系，而不能简单地视为独立的。

3、计算复杂性高： 对于复杂的问题，贝叶斯更新可能涉及到大量的计算。如果参数很多或者模型很复杂，那么计算后验概率可能会非常复杂和计算密集。 例如，在机器学习中，训练一个贝叶斯网络可能需要大量的计算资源和时间。

4、结果可能过于保守： 因为贝叶斯更新融合了先验信念和新的观察，所以如果先验信念过于强烈，那么新的观察可能不足以显著改变结果，这可能导致决策过于保守。 例如，一个坚定的理想主义者，即使面对了新的证据，也可能坚持他的信念，这可能导致他错过新的机会，或者持续在错误的道路上。

如本文开篇所言，我探讨的是“可纠错的反馈闭环”和“贝叶斯公式”之间的关系。 一个“可纠错的反馈闭环”再强大，也可能掉入局部最优陷阱，或是遭遇“黑天鹅事件”。

结局可能就是：一路优秀，99%的时候成功，但却只能是平庸的优秀。 又或者，一直很好，但遭遇了极小概率的黑天鹅事件，一击即倒，无法翻身！

确实，贝叶斯公式和任何概率模型一样，有其局限性，特别是在预测罕见的“黑天鹅”事件时。以下是一些可尝试的方法，以缓解或避免这些局限性：

1、合理选择和更新先验概率： 先验概率是贝叶斯推理的关键组成部分，一定要尽可能准确和有信息量。如果先验概率选择不当，可能会导致结果偏离实际。此外，我们必须时刻准备根据新的数据来更新我们的先验概率。

2、采用蒙特卡洛模拟法： 蒙特卡洛模拟能够帮助我们更好地理解概率分布的全貌，包括那些罕见的事件。通过模拟大量可能的情况，我们可以获得更全面的视角，以期望在遇到“黑天鹅”时，能做出更有准备的响应。

3、压力测试和情景分析： 尽管贝叶斯推理能够给出一个可能的结果，但我们还需要进行压力测试和情景分析，以确定我们的系统或决策是否能够抵御极端事件的影响。

4、注意模型的假设和局限性： 任何模型都是基于某些假设的，贝叶斯模型也不例外。我们必须清楚这些假设，并了解在什么情况下，这些假设可能不再适用。当我们注意到模型可能不再适用时，我们就需要寻找其他的方法。

5、维持谦逊和开放的心态： 面对不确定性，尤其是在面对可能会改变我们的知识或观念的新信息时，保持谦逊和开放的态度是至关重要的。我们需要理解我们的知识和理解都是有限的，永远有学习和改进的空间。

以上这些方法都需要我们理解和接受，无论我们使用什么模型或方法，都不能完全消除不确定性。我们的目标应该是： 管理和减轻不确定性，而不是试图消除它。 这个世界上不存在一个万能的公式，给你以所谓100%的确定性。

十、写在最后：可纠错的反馈闭环，串起人生的项链

可纠错的反馈闭环，对个人而言是非常重要的关键思想。我认为，其底层是一种贝叶斯更新的哲学。反馈闭环基本上是一种连续的过程，包括以下步骤： 执行一个动作、观察结果、理解反馈、更新策略、再执行新的动作。 在这个过程中，"理解反馈"和"更新策略"的步骤，就是在进行贝叶斯更新。 由于时间的推进，在我们的人生当中，每个反馈闭环并不是原地打转，而是犹如链条般串起来。

所谓有算法的人生，就是以“可纠错的反馈闭环”为珍珠，串起不断更新、有复利效应的一生。 我们要小心别断链子，也要避免一条链走到黑。如何成为一位贝叶斯主义的高手？

那么，就让我用一句话体现： 笨蛋，行动起来！不管你有多害怕！