阳志平:关于GPT,一些新认知
阳志平 开智学堂
作者:阳志平 来源:公众号「心智工具箱」
自从 GPT-4 发布以来,短短十来天,人类像来到了一个完全不同的世界。如果未来书写历史,AI 时代的奇点,应是 GPT-4 正式对外发布的这一天:2023 年 3 月 15 日。
关于 GPT 的新闻报道,堪称汗牛充栋,然而,不少认知,却不一定正确。特将平时思考整理成文,供各位读者参考。
01 GPT 是什么
一组花费了十亿美金的大语言模型。而每次运行,同样都花费不菲,耗费的是超级计算机的算力。
想想看,有一个十亿美金的写作软件帮你改稿、找错别字;有一个十亿美金的助理帮你背东西,记住成千上万的术语;有一个十亿美金身家的人不知疲倦地陪你聊天。
这就是划时代的变革啊。
未来,成本必然下降。但我们赶上了当初世界上第一台计算机在 1946 年诞生的那一个时代。
02 更可怕的是 GPT 的使用时长
ChatGPT 是历史上普及速度最快的一个产品,短时间内就达到了 1 亿月活。然而,比月活量更可怕的是使用时长。
如今微信、抖音、快手的日活跃时长大约在 100 分钟。而 GPT 相关产品每日使用时长有望超过 2 个小时。下一步,它可能依托 API,无处不在,成为一个醒来就用的虚拟助理。
这是一种可怕的颠覆。因为本质上,人人都是自恋的,我们更喜欢理解并顺从自己的人。即使这是一个说话慢吞吞的 AI。
03 GPT-4 真正强悍的是推理能力
参考我之前的测评报告:文心一言的理性思维能力距离 GPT-4 差多少?我们第一时间测试了一下
一句话小结:GPT-4 是推理引擎!不是百科!
如果将 GPT-4 想象成一个人类,我们最大的误解是以为它有很强的记忆力。其实不是,它最强的是推理能力。GPT-3.5 的推理能力还只有三分,结果 GPT-4 一下子就到五分了,满分正是五分。
如果用人类的推理能力来类比,莎士比亚的推理能力是九阶,普通人是三四阶,而 GPT-4 的推理能力现在大约根据任务不同,在 3.5 阶到 4.5 阶波动。能写小说,但不够有趣;能理解非常复杂的推理,但仅限于各类条件清晰的。
但这也非常可怕了,也是真正使得 GPT-4 超越其他大模型之处。这意味着什么?就是可以实现真正的个性化学习、数字生命!这才是西蒙、纽约斯等人当年创立认知科学与人工智能时的梦想。
搞得业界心痒痒的。你们家怎么做到的!赶紧放出论文啊!
有人猜测是在训练代码库时意外习得推理能力;而我猜测研发团队引入了类似阿尔法狗的机制,设置了两条推理链相互竞争:显性推理与隐性推理,以及利用了庞大的用户输入数据。
然而真正的做法要等官方论文出来。但我敢打赌,18 个月内,MIT 或斯坦福或剑桥,三个 AI 重镇,必有论文以及开源模型出来。
新时代真的来临了。
04 大模型就是 20 年后的私家车
如果放在 20 年后看大模型呢?它其实就是一部私家车。
世界上第一台计算机诞生于 1946 年,当时造价是 50 万美金。按照黄金比例折算,等于现在的 1200 万人民币。从第一台计算机的造价到如今一台计算机的造价,77 年下降了 6000 倍。按照如今科技的迭代速度,极有可能 20 年成本下降 6000 倍。
如果说今天的大模型是一台价值 10 亿美金的大飞机,造价昂贵,那么 20 年后的大模型,成本可能下降到 16 万美金。一台跑车的价格而已。而成本继续下降,就是一部私家车的价格而已。
未来的格局演化是,普通人搭公交地铁上班,使用公共的大模型;有钱人开私家车或私人飞机,使用更隐私、更个性化的大模型。
05 未来会形成两条路径演化
我并不认为大模型领域,会形成任何实质性的技术垄断。因为数据、算力、模型,在 20 年后都没有任何门槛。
数据:连 OpenAI 团队用的都是 CC 数据,一个互联网开源爬虫项目。
算力:今天看似昂贵,好比我们站在 1946 年,求神拜佛,想借刚刚发明的计算机帮我们跑微积分;然而,到了今天,谁还觉得算个微积分是一回事?算力增加的速度也会远远超过我们想象。
模型:一切都是开源的。OpenAI 团队不开源,但无数顶尖高校团队,也会开源出一个又一个模型。
继续沿用大飞机与小汽车的隐喻,大模型领域的竞争,会形成两类路径:一类是致力于建设公共交通的大模型团队;另一类是致力于开发私人汽车的大模型团队。
这是两类不同的需求。真正容易产生行政垄断而非技术垄断的是在公共交通这条分支上。围绕大模型生产的上下游,同样将涌现出无数新的生态。
06 AI 新时代的演化路线
以 GPT 等为代表的大模型重塑世界,大体上会沿着这个维度前进:
第一阶段:独霸信息世界(10 年内相对成熟)
1、转译。语言与语言之间的转换。翻译这类受冲击最大。当然,还包括将机器语言与人类语言互转。 2、泛知识。一种语言内部,正确与否无伤大雅的那部分。最突出的就是娱乐。 3、认知复杂度较低的事实性知识。一种语言内部,能明确答案正确与否的那部分。最突出的是教育科研的事实性知识那部分。以往刷题能拿到答案的那部分。 4、认知复杂度较高的策略类知识。一种语言内部,极为复杂的那部分知识。答案非常依赖情境。典型如管理、销售、咨询。
第二阶段:干涉物理世界(20 年内成熟)
5、从信息世界到物理世界。先是指挥电脑界面帮我们干活,接着是指挥机器人手臂这类帮我们操作物理世界。
第三阶段:解码心灵世界(100 年相对成熟)
6、从信息世界、物理世界到心灵世界。结合脑与认知科学,一个人一生痕迹能被 AI 当作模式识别。从而生成一个更个性化的 AI。
07 普通人如何应对 AI 新时代
第一步是保证每天使用 GPT-4 至少 3 个小时。只有如此,你才能形成具身的认知。
“认知”这玩意是很昂贵的。今天我们回看 2000 年那时,一个结论很清晰:互联网是个好行业。然而,当时很多人真不这么认为。同样,未来站在 20 年后,回看 AI 时代启动的 2023 年,可能又有无数人为自己的“认知”付出昂贵的代价。
平均来说,你一天可以问 GPT-4 大约 100-200 个问题。你可以提前将 30-100 个问题写下来。这些问题,建议指向具体的作品,最好你手头有示范数据,前期积累。
不断训练自己的提问能力,不断总结复盘与 GPT 沟通的过程,然后你会发现,GPT-4 给你带来的生产力提升会令你惊奇。
不要问 GPT-4 那些泛泛而谈的问题,问那些,你自然得到的不是专属于你的作品,而是套话废话。
GPT-4 特别像一面镜子。它反映的是你过往的认知与积累。如果你是一个博学的理性思维者,那么你看到的是 GPT 给你带来的生产力跃迁;如果你是一个游手好闲的玩家,那么你看到的是 GPT 与你侃大山带来的乐趣。
除此之外,还可以给大家一些建议:
- 所有的年初计划都要推翻重做,因为当初的年初计划少了一个时代大变量的改变。
- 所有的业务都尽量靠近 GPT,放弃过往一切低效的赚钱模式。
- 所有的生产都尽量使用 GPT,用它改造一切你的业务流程。
- 一切曾经成功过的产品,都值得用 GPT 重做一遍。
- 但更有价值的是那些专属于 GPT 时代的独特产品,这才是最大的鱼。
08 AI 新时代的大鱼在哪里
无数人在我问这个问题:大语言模型如何与金融行业、教育行业、医疗行业、游戏行业等等结合。
其实,这么思考,一上来就错了。
参考 20 年前互联网发展的历史就明白了,那时,所有思考,如何用互联网服务自己“过往行业”的,没一家大成的。
产业结合,可以说是互联网行业发展到一个新的阶段之后的任务啊!甚至到了今天,我们也很难说,互联网行业改造了某些传统行业有多么成功。
是诞生了无数专属于互联网行业的产品与服务,才造就了一批又一批传奇。
同样,在今天思考通用人工智能技术、大模型技术,这类重大产业变革机遇的时候,你也要放弃,让技术服务传统行业的思维定势,那样,你拿到的其实是芝麻,却丢了西瓜。
在互联网行业诞生之前,有搜索行业吗?有搜索引擎优化(SEO)行业吗?统统没有。要寻找这类专属于新技术的产业机遇,这类才是 AI 新时代的大鱼。
有趣的是,人人看上的西瓜,反而最后你分不到手,因为大家抢得太厉害了,最后有人就将西瓜打碎了,都喝西北风。
反而是一些人们瞧不上的芝麻,组合在一起,结果成了美味可口的芝麻饼。这就是我如今带队在做的事。
09 AI 时代是一个更好的时代吗
不一定。前 GPT 时代,精英与其他人的差距可能是 10 分与 30 分的差距;而在 GPT 时代,将变为 10 分与 100 分甚至 1000 分的差距。
20 年后,大模型成本快速下降并普及,大模型成为人生外挂:有钱人使用私有模型,普通人使用公用模型。
未来社会,在数字科技加持之下,极有可能二八分布变为一九了。百分之十的精英占有百分之九十的财富。
大模型带来的一个近似科幻的阶层差距变化就是,真正懂大模型的人,有实力训练大模型的人,可以让它随时随地收集自己与家人的数据。然后让其帮自己与家人出席各类需要书面语的场合。实际上,这跟化身万千没有任何区别。
不远的未来,当你还在用自己的脑汁干活儿,而那个跟你协同,或者指挥你的人,可能仅仅是某位富豪的大模型分身之一。而这份分身,消耗的算力甚至远远小于富豪在娱乐上需要的算力。
有那么一些现实版黑客帝国的味道了。■