如何了解人工科学?这本书必读
古严 开智学堂
作者:古严 来源:公众号「古严」
世上总会有一些书,读一两遍就懂,但《人工科学》我用人格担保是你阅读的例外 —— 它就像窗外的雨滴,每天刷新的不只是窗户,还有你的认知与阅读耐心。
01 偶遇 2.15 元的泛黄旧书
为何执着推荐这本《人工科学》?这要回到 2019 年。那时候我参加「认知与改变」读书会,可究竟什么是认知?我近乎茫然。
带着这个疑问打开某旧书网,以认知为关键词展开搜索,发现一本 30 多年前出版的小书 《人类的认知:思维的信息加工理论》 —— 将认知提升到整个人类角度论述,是谁有这么大的能耐?
我迅速查阅目录:记忆系统、联想、直觉、心理表征、学习……直觉告诉我,这些关键词很可能就是「认知」领域的主线。好奇心让我迅速入手这本书,随手一翻,看到大脑运算加法的步骤解析:
① 算完第一步,眼睛注意下一步;② 念一个数字,把它记到短时记忆里;③ 做完一步,得出暂时的和,再加一步,得出新的和;④ 全部算完之后,把总数记到长时记忆里;⑤ 利用早已学会的加法口诀算出结果。
西蒙仿佛人本疗法的罗杰斯,能钻到我心中将过去反复行为但从未思考过的认知原理一一剖析,我认定面对的不只是一个作者,还是一个朋友,甚至是一位知音,这本在几十年前定价 2.15 元的泛黄旧书,一下子就打开了我通往认知科学的大门。
当我继续深挖作者背景,我豁然发现,赫伯特 · 西蒙是一个不折不扣的跨学科天才:他不仅获得了诺贝尔经济学奖、还斩获了计算机科学领域最高荣誉图灵奖、美国国家科学奖章经济学奖、美国心理学会终身心理学杰出贡献奖。
西蒙的研究领域涉及经济学、政治学、管理学、社会学、教育学、心理学、城市规划、计算机科学、认知心理学、应用数学、人工智能、符号学、博弈论等诸多领域,并在他所致力于的几乎所有领域都获得了世界级的最高殊荣。作为一个有着辉煌 52 年职业生涯并得到全世界广泛赞誉的天才,说「百年一见」已相当保守。
时间很快到了 2021 年,此时我正在阅读精神分析学派创始人弗洛伊德的传记,当我发现弗洛伊德在童年时代不断用伟人成就激励自我成长的范式完全可以移植到我自己的育儿场景中,我马上将西蒙那句与工作记忆相关的名言做成印图张贴在儿子的衣柜上:
教育学家杜威曾经说过,有机体与环境之间的相互作用,促进了生活经验的自我更新。
我慢慢意识到,衣柜门上的图片这一情境正在默默发挥它的强大功效:多次无意间瞅见西蒙的这一卓见,居然能够适用于儿子任何学科的指导 —— 从看图写话的流程到数学考题的步骤再到英语文章的背诵……
我都可以让儿子将原本复杂的难题通过 2~3 级逐层分解形成组块从而变得易记易行。短短一句话仿佛化身科学学习的利剑,让他尽情挥舞在知识探索的征途中。
又一次随机漫游,我发现西蒙于 1969 年出版,后经三次修订的《人工科学》一书,当我点开亚马逊读者留言,惊讶对本书的高维评论:
这本书是我多年来遇到的最发人深省、最具挑战性的书之一。所有正确的推理都是一整套无可争议的真理,然而只有上帝能够直接运用这个事实。如果你对书中的每一个句子和思想都怀有阅读和反思的热情,你将领悟到,至今为止,你所感知的世界其实只是黑白两色。
这是怎样一本书,能够被众多读者如此追捧?我立刻买来中文版开始了阅读挑战。
现在,是时候,向你分享这本西蒙晚年的集大成、代表西蒙一生最高智慧之书的核心理念。
02 西蒙和他的朋友们
在这本充满了符号思考、思想实验、抽象术语的《人工科学》中,西蒙引出了一个什么样的新故事呢?
我在写这篇文章时,恰逢一年一度上海国际马拉松报名启动会,一些爱好跑步却从未跑过全马的朋友,会觉得没有能力跑完全马而放弃报名。
他们倾向于认为,如果要参加全马,要么不准备,要准备就要准备最好,这一观点似乎成为小部分跑步爱好者的主流选择。
其背后思想是,如果我们对决策(参加马拉松的可能性)充分地推理分析,然后辅以完备的执行(马拉松准备),就能达成目标(报名)。
而真正体验过马拉松的参与者会清晰意识到,准备固然是马拉松的必要前提,但「让自己准备到最好」其实是一种幻觉。无数马拉松赛场都能看到大量初次参赛者,他们动态准备,先跑再调,用具身体验促进自我决策的持续优化。
西蒙敏锐地觉察到类似现象:既然一个问题决策(比如是否报名马拉松)的作出不需要深思熟虑就能达成,那么原有「充足思考 + 充分推理 + 充实行动」的逻辑就存在问题。
西蒙发现,这一理念受到时代背景的巨大影响,那是 20 世纪四五十年代,二战后世界经济迅速发展,古典经济学家约翰 · 斯图尔特 · 密尔(John Stuart Mill)「寻求个人效用最大化」的乐观经济思潮遍布各地。
人们普遍认为,思考与行为都可以借助理性追求自身利益的最大化,这就是「主观期望效用理论」。
理论假定,决策者拥有关于可供选择选项的完备信息,不仅可以充分理解自己的决策环境,而且对每个可供选择的备选策略所导致的后果也有清晰预测。
在这个前提下,决策者拥有调整权衡一切资源的能力,他能将其统筹到某个单一评估逻辑中,并按照设定好的标准进行优先级排列,最终作出最优决策。
现实中经常会见到主观期望效用理论的普世运用,比如很多企业都致力于完备的目标规划、热衷于管理决策的精准实施,在百度以「执行力培训」为关键词搜索会发现高达 8000 多万条信息……
这些现象都在反复强调一个默认假设:百密而无一疏,只要付诸于足够的理性推理,就能找到最优解,进而实现目标最大化。
事实真的如此吗?西蒙结合组织学、经济学、决策学、认知心理学等维度对主观期望效用理论进行了有力批判,并提出「有限理性」这一替代模型。
什么是有限理性?它认为人类决策过程受到大脑算力、认知偏差、时间、情绪和已知信息容量等条件限制,不得不利用捷径作出决策,这些捷径降低了决策难度,提高了决策速度,但同时挑战了理性。
简言之,人们的判断是基于有限的信息量与认知能力,我们最终寻找的是满意解而非最优解。
一个常见案例比如,每年 618 购物节,消费者看到商家对某家电「全年最低价、买贵十倍偿、错过今天,后悔一年」的正式承诺,所以迅速下单。
但在双十一发现同款产品价格只比 618 贵一分钱的「不违规」现实;更严酷的事实是,这些被商家宣称的低价产品往往属于能耗较高型号,消费者无法在下单的冲动期内知晓并精准计算电器使用周期的电费成本,所以最终做出了一个有限理性的非最佳购买决策。
西蒙发现,虽然主观期望效用理论结合了两个概念:第一,满足个人目标的效用函数 ,第二,基于贝叶斯概率理论的概率分析,因而变得简洁易行。但它成立的前提是存在一个全知全能的理性人,其有能力通过对所有可能选择项进行完整与精确计算从而做出最优选择。
这就预设了一个传递性原则:如果意识到有 ABC 三种选项,A 优于 B,B 优于 C,那么 A 必定优于 C。但在现实情境中,人们往往并不会(或无法)对选择项进行全面比较与评估,而是根据某些特定原则或情境,只考虑部分选项(比如只将 A 和 B 进行对比)。
所以西蒙强调,现实情境中的推理并不一定是从总体上产生最优结果的选项。不考虑全局成本,只顾及部分成本而被初判为有缺陷的推理反而可能是有价值的。
这一结论很快得到了心理学家阿莫斯 · 特沃斯基(Amos Tversky)的认可:在没有进行决策标准敏感性和评估选择方案所需成本的详细分析下,关于人类理性的明确结论似乎难以得出。当考虑到评估的困难性(或成本)和判断的一致性(或误差)时,一个可能会打破「优选连贯性」原则的决策方法可能显示出更高的优越性。
受益于西蒙「有限理性」启发,特沃斯基与挚友卡尼曼开始进一步思考:既然寻求满意解而非最优解是人类决策的底层原理,那么如何找到一条行之有效的简单模型?
最终,特沃斯基与卡尼曼推出了「前景理论」(Prospect Theory)并摘得 2002 年度诺贝尔经济学奖桂冠。
德国心理学家吉仁泽(Gerd Gigerenzer)也从西蒙手中接过有限理性的研究接力棒,从更细致维度对有限理性的实践进行了广泛探索并由此提出「有限理性适应性工具箱」。
有限理性仿佛一颗学术种子,在不同科学家的探索中有力生长,不断传承。
正是因为基于对有限理性的底层理解,西蒙综合经济学、心理学、学习科学、设计科学、管理学、复杂性研究等,尝试站在不同学科基础上提出一种「人工科学」。人工科学,顾名思义,也即研究人工造物的科学。西蒙提出人工造物的四大核心特点:
- 人工物是由人工合成(虽然并非总是周密计划的产物)。
- 人工物可以自然物的外表但并不完全具备自然物的本质特征。
- 人工物通过功能、目标、适应性三方面表征。
- 在讨论甚至是设计人工物时,经常着眼于描述性和规范性。
这一归纳极富创造性,不仅界定了人工科学的概念边界,更强调了人与人工物的彼此交互与运作的原则,大大扩充了人工科学的生命周期,使得这本书在出版半个多世纪后,依然被读者认定为「100 年后依然有效的现代技术」。
03 从 7±2 寻找破解之道
既然人对外部复杂环境的适应受到有限理性影响,那么理解人工科学内部系统的关键,是找到限制人运作的核心变量:究竟是什么导致了有限理性?「有限」的边界又在哪里?
针对这几个问题,西蒙以实验心理学为主线,将焦点放在在记忆层面展开了探索。
对大脑的探索是一个极其复杂的课题,西蒙巧妙采用「存储 → 提取」的抽象维度进行简化:存储是大脑对外部信息的识别与处理,提取是大脑的对信息的反馈,存储决定提取。
在存储阶段,西蒙发现,大脑将吸收的信息转入长期记忆存储需要一个相对固定时长 —— 8 秒。
这意味着,在信息被感知后的记忆存储环节,大脑存在存储时间长度的天然限定。如果外部情境复杂程度提升,那么应对和处理速度将变得缓慢,这似乎可以成为有限理性的初始限定。
但问题似乎没有这么简单。西蒙发现,如果把一个布局合理的中盘棋局展现给一位象棋大师,他往往在看棋短短 5~10 秒后就能走出下一步,并且这一步往往就是棋局中的最佳走法。
而对于一个象棋初学者,面对相同棋局,往往不知所措,会消耗更长时间。为什么象棋大师能够如此快速回应?是因为象棋大师有着远超凡人的记忆力与反应速度吗?
西蒙从心理学家乔治 · A · 米勒(George A. Miller)关于大脑记忆容量的研究文章《神奇的数字:7±2》中找到了解题线索,该文强调大多数人一次性只能记忆 7±2 个数字,所以大脑短时记忆容量为 7±2 个项目。
米勒提出的数字「7」,成为西蒙破解大脑适应外部环境限制的关键入口:
实验人员提供给象棋大师的中盘棋局,在象棋大师眼中并不是杂乱摆放的数颗棋子,而是由多个≤7 颗棋子所组成的「棋块」,识别出这些棋块之后,象棋大师在大脑的长期记忆中迅速搜寻与之相同的「棋块」,如果发现匹配,就自动关联出与之对应的走法。
而这些「棋块」的总数,差不多在 50000 个左右,对比一个受过高等教育的人差不多能识别 50000~100000 个不同的词汇而言,经过长期训练的象棋大师,记忆并识别 50000 个棋块并非难事 —— 这些棋局就好像象棋大师的朋友,棋盘上各个棋子不同组合形成的数量,就是他们熟悉老朋友的数量。
所以,旁人看来象棋大师不可思议的快速应局,其实只不过是人类大脑经过训练后的正常反应而已。
需要强调的是,在《人工科学》这本书的撰写年代,受限于实验科学技术限制,很难对大脑短时记忆容量进行更精准评估,所以 7±2 这个数值只是科学探索史上一个广为流传却未被正确理解的笑话。心理学实验证实,大脑短期记忆容量只有 3~4 个项目。
至此,造成大脑有限理性的内部关键变量已被西蒙确定:
- 信息存储的时长;
- 信息存储的形式。
西蒙的这一发现对于认知科学的运用有巨大促进意义。试举例:
当你在一片原始森林穿梭,突然看到一片大草原,请问这片草原的颜色是什么?也许你会说,不就是绿色吗?但从科学角度来回答这个问题时,答案是否定的。
人眼可以感知到不同的可见光谱,当物体将一种颜色的光反射到眼睛时,就会将其感知到对应的颜色。对于小草而言,是通过叶绿素的色素物质来吸收光子能量,然而叶绿素对吸收的波长非常挑剔,它喜欢吸收红光与蓝光,而将剩余的颜色反射。
所以,小草看起来是绿色,并非源于小草本身为绿色,而是因为它们有效吸收了红光与蓝光,只有绿光被反射到了人眼,再通过视网膜的视锥细胞将反射光转成电讯号传递给大脑,大脑经过分析后就告知自己看到了绿色。
更进一步,人类所感知到的信息会受到自身器官的本能限定进而导致存储的差异,比如人眼只能感受波长 7700-3900 埃的可见光,耳朵只能感受 20-20000 赫的声波。
因为情境、能力、族群的影响,这些感知会进一步产生差异。所以,我们不能强行默认两个人对同一事物的理解与认知基础完全一致,世界上没有任何两个大脑在过去或未来会完全相同,每一个人都是自己独特体验的建筑师,这是理解有限理性的重要基础。
除此之外,西蒙这一发现在教育系统中极具参考价值。从认知神经科学角度来看,学习的本质其实是不同神经元之间更加高效的联结来完成信息在大脑的存储与提取。
对于「存储时长」而言,需要主动留给学生多次复习核心知识的时间段,通过重复实现关键信息在大脑中的牢固存储。
对于「存储形式」来说,需要帮助学生学会对知识的元组块,将不同学科之间、不同主题之间、不同模块之间完全不相同的知识关联,形成组块以助力长期记忆。
但这两点在当代内卷化的教育环境中被双双忽视,大多数学校往往强调学习内容的广度,超纲教学、不同学科老师争抢学生的作业时间,却忽略了权重知识的深度探索和不同学科的内部关联,繁重且独立的作业直接导致学生对基本技能的习得薄弱,头脑中单纯概念无法有效关联,最终沦为碎片化空知。科学教育,任重道远。
西蒙将人类适应外部环境内部关键变量的确认,就像打开了人类大脑的潘朵拉宝盒,大大提升了科学家探索未知领域的可能性。
04 挑战学科建构
寻找到有限理性内部限定机制的核心要素后,西蒙给自己创造了一项更为宏大的挑战 —— 如何建构人工科学的基础框架?西蒙从两个层面展开论述:
一、机制设计
- 评价理论:效用论,统计决策论
- 计算方法:最优算法,满意算法
- 设计逻辑:命令逻辑,叙事逻辑
二、备择搜索
- 试探搜索:系统分解,手段-目的分析
- 资源分配:成本-收益分析,深度>广度
- 层级系统:功能,机制
- 设计表现:简化,传播
西蒙就像是一个建筑师,为我们设计了一座人工科学宏伟建筑的两大支柱:机制设计和备择搜索。
机制设计就像是建筑的基底打造和楼体设计,在这个过程中,西蒙强调用算法和逻辑将设计问题分解成更小、更易理解和操作的部分,同时增强命令逻辑的优化保证建筑的牢固与安全,并引入了新的叙事逻辑来强调建筑的创新与灵活程度,以适应各种不可预见的复杂情境。
备择搜索则像建筑的装饰和优化,通过手段-目的、成本-收益等维度的分析、辅以机制和功能的权衡,确保建筑设计方案在满足使用需求的前提下,同时富有生命力与美感。无论是设计还是搜索,都需要考虑建筑与外部环境的关系,以确保它能够完美地融入到生态环境中。
机制设计的另一大亮点在于,无论是最优方案计算或是满意算法探索,西蒙都反复强调行动的激活频次,强化个体对情境的适应能力。
常有人对自己的计划中止抱有善意宽容 —— 因为我突然很忙、因为项目太难、因为尚未找到行动的条件……所以我要等:等我有空了再开始、等我找到方法后再开始、等有行动条件后再开始……可事实往往相反,这些预设情境可能永远不会到来。
西蒙强调,一个人行为随时间而表现出来的复杂性主要受到他所处环境复杂性的反映。计划开始后的忙碌、项目推进的困难、行动的前提失衡等全部都是情境复杂性的正常形态,我们正是在种种确定与不确定的环境中、已知与未知交错的前提下,可控与失控的平衡中,不断摸索,试探前行。
鹰击长空,捕获飞速躲避的兔子。显然,鹰没有也不可能事先计算好自己和目标的逃跑轨迹,然后再根据确认的路线飞行。而是当鹰发现兔子后,马上预估它和兔子的大致距离与相对位置,然后迅速启动翅膀选择一个大致方向朝兔子飞去。
不论过程中兔子怎么跑、朝哪个方向跑,鹰的决定就是不断缩小自己与兔子之间的距离,直到差值为零。
老鹰看见兔子后首先启动翅膀起飞而不是完美计算自己捕获兔子的成功率再行动的模式,与西蒙「试探优先」的行动策略如出一辙。对于未知领域的探索,我们需要强行动,弱计划,干了再说。
在备择搜索层面,西蒙认为,当我们面临复杂的设计问题时,不应该只是追求满意解,而应该欣赏并利用备选方案的多样性。
这一点相当反常识。常言道「人无目标不不立,事无目标不成」,给自己制定清晰完备的目标,然后全心全意执行,几乎是经久不变的真理。
但这个认知背后,隐藏着一个默认假设:我们的所有行动根源于前期所设定的目标,所有的评估都来聚焦于目标的达成程度。但这样将导致多样性的丧失,生活只是按步照搬的实现,惊喜与创新将变得稀有,伟大成就将与自身无缘。
反观西蒙,用「迷宫」来隐喻人生对未知探寻的自主意向,将多样性视为信仰,一生坚守内在动机,跨界探索,反而取得了举世瞩目的伟大成就。
西蒙的人生模式提醒我们,对于问题的探寻,不要仅仅重视搜索结果,更应重视搜索过程本身。多个备选方案意味着我们有更多机会进行探索与创新,不仅有助于找到满意解,还可以从搜索过程中获得更多意外之喜。
当满意解探寻完毕,西蒙还贴心给出了对满意解的简化传播设计。我们不仅要找到复杂问题的解决之道,还要学会用简洁优雅的形式将知识承载与传播。正如西蒙所言「解决问题仅仅意味着要将问题表现得使解答方案明显可见」。
如何降低知识传递与沟通的障碍?我们可以从前面提到国际象棋获得更多启发。大师与业余爱好者的区别,体现出专家和新手在知识组织层面的重大差异:他们所掌握的概念、事实与技能之间的联系密度或数量不同。
相比新手,专家能够根据先前经验迅速识别出一些有意义的模式与结构,以一系列深层的特征对知识进行分类组合,灵活构建和运用多种知识组织,因此往往能够跳出一些常规步骤,走新手不能走的捷径。
而专家的这一优势在自主探索时极其有效,但面向新手或大众的知识传播时会面临阻碍 —— 先行知识欠缺的新手无法理解先行知识内隐的专家的解读,最终形成「知识诅咒」。
解决这一困境的有效方法,就是西蒙反复提及的直观符号(类如信号灯颜色、剧毒品包装纸上的骷髅)、形式转化(类如将抽象文本转换为流程图、关系图)、维度更新(比如从平面知识到立体模型的运用)、跨界呈现(比如将同一知识用不同学科的知识呈现)等,以提高信息被不同认知基础的人成功识别与理解的可能性。
到此为止,西蒙已将人工科学的内容框架搭建完成,只待希望通过设计改变自己、影响世界的人去探索、去行动、去创造。
05 小结
微软创办人比尔·盖茨提到,人工智能模型 ChatGPT 是他一生中遇到的两项革命性技术之一,复杂人工智能已经成为现实。但盖茨也许想不到,早在 50 多年前,西蒙就预言机器将能够完成人类能够完成的任何工作。
在人工智能如火如荼的此时此刻,如何建构面向未来的持久竞争力?现在,让我们拿起《人工科学》,跟随西蒙脚步,寻找属于你自己的答案!■
㊟ 《人工科学》已绝版,目前由人民大学出版社于 2023 年用《人工智能科学》的新名称重新出版。