科普信息网

只问新不新,不问好不好

发布时间:2023-08-30 09:56:27 来源:科普时报 责任编辑:caobo

《为什么伟大不能被计划》,[美]肯尼斯·斯坦利,[美]乔尔·雷曼著,中译出版社2023年4月出版。

创新,是一件神奇的事情。要知道,一些实现伟大成就的发明家并非比同行更勤奋、更努力,而是因为他们经常能捡到意外的宝藏。


(资料图)

最近全球最令人瞩目的重大创新事件是一个生成式人工智能模型ChatGPT的诞生。我认为这可能是工业革命以来最了不起的发明之一,它由OpenAI研发,且在最初并未得到美国政府的特别关注。

OpenAI的四位领导人都是三四十岁的年纪,领着几十位研发人员组成了一家小公司,采用了一个当初包括谷歌在内的大公司都不看好的技术路线,搞出了最震撼的科技。

伟大发明多是意外所得

当你考察科技史时,你会发现,伟大的创造几乎都是由一些谁也想不到的人,在谁也没计划的领域中做出来的。比如,比尔·盖茨迎合极客打游戏的需求普及了个人电脑;硅谷的一个车库里诞生了谷歌;埃隆·马斯克起家是在网上支付领域,最后却推出了SpaceX和特斯拉。

对比之下,那些由政府从上而下主持的大科研项目呢?

1971年,时任美国总统尼克松发起一场“癌症战争”,但貌似什么都没干出来;1982年,日本通商产业省搞了一个为期10年的大项目,投入巨资,要研发第五代计算机系统,也是没有突破出来。历史上似乎是唯一一个由政府主导,且最后获得成功的大科技项目,就是时任美国总统肯尼迪为了跟苏联竞争而推动的载人登月计划。它激励了后来的各国政府,但仔细考察,彼时美国其实在很大程度上已经具备了相关科技能力——并不能称得上是奇迹。

如果路线已经近在眼前,你当然可以设立目标、制定计划,多花点钱加速进行。但是真正的伟大突破是不能计划的。

所以我们确实需要进一步的解释,为什么伟大创新一定是意外所得?

目标会窄化你的探索范围

肯尼斯·斯坦利和乔尔·雷曼的《为什么伟大不能被计划》一书,算是把这个问题彻底讲明白了。两位作者都是人工智能专家,而且都有在OpenAI工作的经验,可谓当今科技领域的前沿人物。他们对于书名这个问题的解释,来自一个AI算法。

比如,你想要从一些简单线条出发,演化出好看的图片,或者让纸面上的机器人走出迷宫,又或者让一个三维空间中的机器人学会直立行走,你应该怎么做呢?

直觉上的做法是先设定AI算法的演化目标,在演化的每一步都进行筛选,接近目标就加分,否则就淘汰。但实验中这个做法的效果并不好。

肯尼斯和乔尔发明的算法叫作“新奇性搜索”算法,这种算法会随机生成一组解决方案,通过评估新奇性并保留新奇性比较高的方案,从而像生物演化一样发生一定的变异,如此往复循环,直到达到预定的迭代次数或者将问题彻底解决。

这个算法在迭代过程中完全不考虑一个方案是否有利于接近目标,哪怕这个方案是往墙上撞,或者一站起来就跌倒。产出的方案再怪异、再不靠谱也没关系,只要是新奇的就留下——只问新不新,不问好不好。

然而各种实验都证明,这种方法找出来的方案最能解决问题。它能生成最好看的图片,能最快找到迷宫的走法,能让机器人最快学会直立行走。这是为什么呢?

一个原因便是求新就意味着求复杂。简单的方案总是先出现,等你把简单的方案都尝试过之后还要新的,出来的就一定是更复杂的方案。复杂意味着掌握更多的信息,掌握信息多意味着更高级,也就更容易解决问题。

如果你一开始就向着一个明确的目标努力,你就走不远。目标会窄化你的探索范围。比如,想教机器人直立行走,如果你一开始就一门心思想着直立行走,你就会刻意避免能让机器人摔倒的方案。可是恰恰是那些会摔倒的方案教会了机器人踢腿!学踢腿,自然就容易摔倒;可是不踢腿,怎么能会走呢?

而对新奇性搜索算法来说,机器人从“不会摔倒”到“会摔倒”,绝对是大好事!机器人会的越来越多就意味着越来越高级,便自然将会直立行走这项技能收入囊中。

新奇性搜索算法不预设具体目标,但是它有价值观的指引,这个价值观就是新奇和有趣。

这就如同一个小孩,一开始觉得看电视很有趣,家长对此很不放心,认为是浪费时间。但是孩子不会一直觉得看电视最有趣,他很快就会发现打游戏比看电视有趣多了,于是他会把精力转移到游戏上来。而只要他眼界够高,他迟早会发现世界上还有很多比打游戏更新奇、更有趣的东西,比如自己编程、自己制作游戏,最后他会发现搞科研更新奇、更有趣……

没错,真正能把追求新奇、有趣坚持到底的,都不是一般人。如果你一开始就认准了想要得到一个什么样的珍宝,你就不会得到珍宝;最终得到珍宝的人,只是一直在寻找下一块踏脚石……他们得到的都是意想不到的珍宝。

(作者系科学作家。本文节选自《为什么伟大不能被计划》序言,标题为编者所加,内容有删改。)

标签:

上一篇:17种图书入选 第三期“新发现·科普书单”
下一篇:最后一页

新闻排行