【主持人语(中国人民大学吴玉章讲席教授刘永谋)】:随着ChatGPT、Sora等生成式人工智能(GAI)工具爆火,近来关于通用人工智能(AGI)的话题再一次被热议。有人认为,大语言模型(LLM)接近或已经就是AGI了。实际上,AGI一直并非人工智能发展的主流,很多技术专家都公开表示过反对AGI的想法。围绕“AGI的本质”的问题,特邀科学技术哲学与人工智能技术专业领域的资深学者进行深入探讨。刘永谋从技术、宣传和人文三个方面对当前通用人工智能之话语展开审度,以期寻找适合中国国情的通用人工智能辩证发展之路。刘伟则从通用人工智能在技术层面的实现所面临的三大困境出发,提出一条人-机-环境系统智能生态之构建的新路径。杨庆峰指出,“多模态大模型走向通用人工智能”只不过是多模态论者的一种信念,该信念包含失误,而通用人工智能只是走向超级智能的三条通路之一,另外两条是具身智能与交互智能。闫宏秀对通用人工智能之“通”道含义展开了深入分析,呼吁技术发展更应关注人的维度。
本系列文章原刊《哲学动态》2024年第9期。
闫宏秀(上海交通大学科学史与科学文化研究院)
【摘要】从整体论的视角来看,若以通用人工智能之“通”旨在凸显其不同于专用人工智能仅限于特定领域的观点为依据,通用人工智能必须具有更为基础的逻辑,规划的整体性与性能的全域性是其核心;若以通用人工智能之“通”旨在追寻与人类智能的相似性为依据,人工智能技术的顶层逻辑应将智能视为整体,底层逻辑应将人的生物性也视为整体。从通用人工智能等级的划分来看,以性能为出发点,通用人工智能之“通”应当以功能层面的实现作为必要条件,需要关注认知和元认知,并应将诸如常识的实践智能纳入。从实践智能的视角来看,其获取、提取与表征是走向通用人工智能之“通”的必要环节,且要充分考虑人类智能与机器智能之间的差异性与同构性。但无论如何,基于人类生存的需要而依赖技术,更应警惕借技术之名走向技术的非人性化。因此,通用人工智能之“通”更应关注人的维度。
从人工智能的发展史来看,“人工智能能否与人类智能相当”一直是一个核心议题,并成为了导致人工智能兴衰的一个重要原因。迄今为止,关于“何为通用人工智能”仍尚未形成共识,但关于其的向往则一直是人类对于人工智能的一种描绘。虽然戈策尔(B Goertzel)等人于2002年就已展开了关于通用人工智能的相关研究,但正式公开使用“通用人工智能”(AGI)这一术语则是2006年,且之所以选择使用这一术语是“因为它正确地强调了研究目标和研究范围的通用本质,且没有对任何理论或技术给出太多承诺”(Goertzel & Wang,p2)。因此,面对通用人工智能究竟是一种炒作、一个伪命题、还是人工智能发展终极目标等的争执,暂不论关于“人工”“智能”的概念辨析,“通”毫无悬念地成为了上述争执的靶心。特别是当我们把“通用”作为“人工智能”的限定词时, 关于“通”的解析既是对通用人工智能的概念及其本质进行厘清的必要前提,更是导引人工智能有效发展所必须面对的一个基础性问题。
一、基于整体论视角的通用与专用
在走向通用人工智能的历程中,以“专用”为基础打开“通用”的研发路径一直被高度重视。那么,这是否意味着,“通用”即“专用”的汇集或者合集呢?然而,现实是如罗埃布莱特(H Roitblat)所言,将“过度依赖过程(processes)的一小部分集合作为构建通用智能的充要条件”和“认为其所研究的问题完全代表了实现通用智能所需要解决的问题”视为通用人工智能发展中的两个错误,并认为视“规模和速度为将这些系统拓展到全面实现‘类人智能’的唯一限制”也是错误的。(参见Roitblat,p4)易言之,走向“通用”的人工智能不是依赖分解式的汇集,基于专用人工智能的累积并不是正确的实现路径,二者之间存在着质的差异,类似于汽车与跑得快的马车。 因此,从某种意义上,以“专用”打开“通用”的逻辑类似于“整体是由部分汇集而成的”,而结合哲学界关于整体与部分关系的探讨,上述逻辑的有效性必将遭遇质疑。特别是在当下,各智能体(agent)之间所产生的涌现性问题使得该逻辑面临更多挑战。
然而,回顾王培和戈策尔在2006年对于通用人工智能八条反对意见的解析, 人工智能通用性的实现确实需要以专用人工智能为要素,但通用人工智能并非要解决所有领域的问题。(参见Goertzel & Wang,pp4-8)罗埃布莱特则将“从专用人工智能可以推导出通用人工智能”视为邱奇—图灵(Church Turing)论题对计算机科学家们的误导。(参见Roitblat,p291) 由是,该如何看待“通用”与“专用”的逻辑关系就成为了“如何实现通用人工智能”的一个基本问题。
若以通用人工智能之“通”旨在凸显其与专用人工智能仅限于特定领域不同的观点为依据,通用人工智能必须具有更为基础的逻辑,且能从特定的问题得出更为通用的原则,并具备更为泛化的能力。与此同时,对于通用人工智能的评测若是基于特性问题的解决,那么,这意味着其应该包含专用人工智能但必须高于后者之合集。基于此,规划的整体性与性能的全域性是通用人工智能的核心,类似罗埃布莱特对邱奇—图灵论题所提出的质疑那样,通用人工智能必须是在超越专用人工智能的基础上,拥有更多的效力。然而,且不论部分离开整体的效力如何,不同类型的诸多智能体之间的融合逻辑必定是通用人工智能所必须解决的重要问题。通用性与专用性两者之间的逻辑融贯性必须从整体的视角进行,最理想的状态是两者逻辑完美自洽。但从人工智能的发展史来看,这种自洽依旧尚未到来。因此,此时我们需要谨慎处理两者逻辑的优先级问题。毫无疑问,若以专用人工智能为逻辑优先,则需要考虑通用人工智能的整体有效性,避免变成不具有通用性的散装式拼盘;反之亦然。若以通用人工智能为逻辑优先,则需要考虑专用人工智能的性能问题。
若以通用人工智能之“通”旨在追寻与人类智能相似性为依据,通用人工智能技术应具有迁移学习能力、感知能力、同理心、非单调推理能力等人的生物性特征。在某种程度上,这意味着单一智能不能被视为通用人工智能。基于此视角,人工智能技术的顶层逻辑应将智能视为整体。与此同时,基于通用人工智能与人类智能相似性的视角,人工智能技术的底层逻辑应将人的生物性也视为整体。然而,德雷弗斯(H Dreyfus)的四个假想(即物学假想、心理学假想、认识论假想与本体论假想)对人工智能的哲学审视,明斯基(M Minsky)对于早期程序缺乏通用性的批评,以及专家系统的局限性等,已经能够充分说明上述追寻虽然非常有趣且极具吸引力,但实现难度也很高。更值得关注的是,依据该判断,参照与人类智能相类似的通用人工智能标准,“通”的构建需要走出既有的机器之“专”。因此,在当下,从具体的技术研究层面来看,具身感知、情感认知等已经成为了当下通用人工智能的主攻方向,当下智能技术在形象塑造与功能模拟方面的不断拟人化趋势可谓对上述要求的一种有效回应。
类似图灵在1950年的构想,即若希望机器最终能和人在所有纯智力领域竞争,那么,诸如国际象棋之类的抽象活动和采取类似教孩子一样的方法去教机器学习这两种方式都值得一试 (参见Turing,p460),故通用人工智能之“通”注定是从“通”到“专”或者从“专”到“通”两条途径,特别是当通用人工智能是以模拟人类的认知为切入点时,认知本身的系统性与复杂性使得基于专家系统的途径面临基础架构统一性的难题。因此,从整体视角看,基于“专用”的汇集不能被视为是真正意义的“通”。近期类似ChatGPT、Bard等在超越具体领域或曰与领域无关即“开领域”的对话能力被视为通向通用人工智能的一个里程碑,但对其输出内容的真实性、准确性、情境性、专业性等的质疑则直接指向了基于此的通用局限性。或许思维的通用性与领域的细分之间关系类似于医院系统的综合科室与专门科室的关系,通用人工智能在作为提供解决问题的切入点或曰“接口”意义上体现了其“通”的特性。正如王培和戈策尔所言,通用人工智能并不是要解决所有领域的问题:“当我们说人类大脑或者一个计算机系统是 ‘通用的’时,并不是指它可以解决所有领域的所有问题,而是指在有适当经验的条件下,它拥有解决任何领域任何问题的潜力。”(Goertzel & Wang, p5)那么,“通用”的等级划分问题随之而来,即究竟在何种意义上人工智能应当被视为“通用的”?
二、基于通用人工智能等级划分之“通”
关于通用人工智能的等级划分事实上就是追问能够在何种意义上确立关于“通”的标准。在人工智能分级中,图灵测试一直被视为一个重要的判据。如,在英国社会学家柯林斯(HCollins)所划分的六个等级的人工智能中,图灵测试被置于首要位置。(参见Collins,p77)其中,第三、第四和第五等级的人工智能都要求通过图灵测试。也就是说,从第三等级开始,与人类类似的流畅性开始出现,机器具有从事多态行为的能力。但DeepMind的莫里斯(M Morris)等人则在关于通用人工智能等级划分中明确指出:机器的思考性与机器的实际能力无关,关于通用人工智能的界定不应当从过程而应当从能力着手,特别是关于机器是否具有意识等的无法判断使得侧重过程的判断更不适合作为通用人工智能的判别依据。(参见Morris, et al)“欺骗性对齐”“幻觉”“越狱”等的出现更意味着用图灵测试来判定通用人工智能早已不够充分。虽然关于通用人工智能的界定尚未达成共识,但是“有一个清晰的定性含义。粗略地说,通用人工智能的含义是指拥有一定程度的自我理解能力和自主自控能力的人工智能系统,它们有能力在各种环境下解决各种复杂问题,并学会解决它们在创建时不知道的新问题。”(Goertzel & Pennachin, pvi)因此,既然人类对通用人工智能的期望包含其能对更多问题的有效、主动解决,甚至被神话为可以考虑人类未曾设想的问题,那么,基于性能效用的判断更为符合技术的发展。
从人工智能作为技术的维度来看,性能是其必须具备的基本条件。诺维格(P Norvig)等人认为通用人工智能已经来临,其论证逻辑是将ENIAC 通过顺序、循环和条件指令的编程功能视为通用性的展示。此时的通用人工智能之“通”指向了任务的可被编码化与程序化,特别是当人工智能大模型具有了完成诸多任务的能力,且无需对每个任务进行明确训练时,其被认为在主题、任务、模态、语言和可指导性五个方面已经实现了通用。(参见Agüera y Arcas & Norvig)因此,基于此的通用人工智能之“通”主要是指向了技术的主动学习性、多模态的融合性、任务完成的有效性特等。易言之,通用人工智能之“通”应当以功能层面的实现为必要条件。事实上,这个必要条件恰恰就是人工智能进行等级划分的重要判据。
在莫里斯等依据性能和通用性两个维度所展开的等级划分体系中,从包括学习新技能在内的多种非物理任务范围的通用性维度来看,相当于或稍优于普通人的通用人工智能已经出现,而至少达到熟练成年人中等水平的人工智能则尚未出现;从特定的任务或任务集的专用维度来看,如AlphaFold、AlphaZero等超越人类性能的专用人工智能已经出现。(参见 Morris, et al)这种划分方式非常清晰地勾勒出了“专用”与“通用”之间存在的差异,虽然特定领域的专用性发展会促进通用性的提升,但两者之间的关联性并非必然同向与同步。虽然在解决特定问题方面的“通”已可被视为具有超人类的性能,能完成超乎当下人类能力的任务,但这并不意味着“通用”的到来。机器系统在不同领域中间进行知识迁移并归纳出通用的原则是通用人工智能必须具有的能力。也就是说,通用人工智能之“通”需要关注认知和元认知,“元认知能力(如学习新任务的能力或知道何时向人类寻求说明或帮助的能力)是系统实现通用性的关键先决条件”(同上)。
上述观点与诺维格等人从五个方面判断通用人工智能来临的观点相映成趣,主动学习、知识迁移、情境适应性、可指导性等应是通用人工智能的基本功能。然而,苏莱曼(M Suleyman)和巴斯卡(M Bhaskar)则在将性能进行细化的基础上,提出了可以“在最少的监督下实现复杂的目标和任务”的“人工能力智能” (Artificial Capable Intelligence,ACI),且认为其“代表了人工智能发展的下一个阶段”。(参见 Suleyman & Bhaskar, pp77-78)术语“人工能力智能”非常明显地突出了“能力”或曰“性能”,但仍然不是通用人工智能,而是类似于人工智能与通用人工智能之间的中间层,即“人工智能和通用人工智能中间的快速路径:虽然其能完成大量的复杂任务,但要成为完全的通用则还有很长的路要走”(同上, pvii)。在这条“很长的路”中,如何呈现或者融合人类常识(common sense)就是一个重要的问题。如莫拉维克悖论(Moravecs paradox)所示,该问题是目前基于推理的机器所难以跨越的一个障碍。该问题恰恰也指向了通用人工智能的元认知问题。事实上,诸如人类的常识等实践智能(practical intelligence)是否可以转译为机器语言一直是困扰着人工智能发展的难点之一,亦被视为判别机器智能是否可以与人类智能相媲美的关键。从对通用人工智能的等级划分来看,包括常识在内的实践智能作为一种性能至关重要。因此,对于通用人工智能之“通”的考察必须将常识纳入其中。
三、基于实践智能视角的通用人工智能之“通”
早在20世纪中叶,维纳(N Wiener)就给出了“如果我们能够造出一部机器,其机械结构就是人的生理结构的复制,那我们就可以有一部机器,其智能就是人的智能的复制”(维纳,第42页)的论断。从中我们可以看出,从对人之生理机构的复制到对人之智能的复制,在逻辑上存在可行性,且可以是技术发展的目标之一。当今机器人、人工智能等的发展就是该论断在某种程度上的有力证明。但两者之间是否可以事实上如此,却恰恰成为了通用人工智能研究的一个重要论域。特别是逻辑推理、机器学习等技术能否习得或者获得的人类隐形知识(implicit knowledge)成为了评判通用人工智能的一个标尺。隐形知识与显性知识(explicit knowledge)在人类社会中都发挥着重要的作用,特别是隐形知识, 因其所具有的灵活性、情境性、非理性、整体性等特征而被视为人类所特有的能力。这种能力就是斯腾伯格(R Sternberg)所言的“实践智能”,对于解决问题有着极为重要的意义。(参见Sternberg)
依据通用人工智能可与人类智能相媲美的标准,包括常识在内的实践智能作为一种隐形知识,其如何被获取、提取和表征,就应当是人工智能走向“通用”的一个必要环节。关于此,我们从人工智能的发展历史可以发现,符号主义、连接主义和行为主义三种路径的相互借鉴与融合在呈现出了人类在研究人工智能方面所取得的成就的同时,也变相说明了人工智能完成实践智能的难度。人工智能在常识方面存在的问题通常被理解为两个方面——“构建通用人工智能远远超出了我们目前的能力”,但“人工智能要想成为通用人工智能,我们需要让其具备我们所认为的与常识相关的各种能力”。(参见 Müller,pp155-156)
因此,常识的缺乏被视为是聚焦于特定领域的专用人工智能走向通用人智能的最显著并最重要的障碍。不妨再次回到维纳的提醒,即“那些在人与其他生命体的情绪和现代类型的自动机的应答之间截然划分上一条不可逾越的鸿沟的心理学家们,在他们作出否定的结论时,应当像我作出肯定的结论时那样地小心谨慎”(维纳,第56页)。就此而言,伴随人类对自我了解的深入与相关技术的发展,上述“鸿沟”已经呈现出了被弥合的迹象。如关于机器常识(machine common sense)的概念界定、构建途径等的探讨(参见Gunning; Gavrilenko & Morozova)就是尝试补齐人工智能常识缺乏之短板的努力;而人工社会智能(Artificial Social Intelligence,ASI)在斯腾伯格的智能分类体系中,基于社会智能的能力似乎与实践智能概念的最恰当表述略有差异,因此他将社会能力分为“社会智能”和“实践智能”两种。(参见 Sternberg, pp258-259,p268,p278)但事实上,“社会智能”可以被看作“实践智能”的一个子集。等研究致力于机器表征社会智能的尝试,则被视为“实现与人类同等水平的通用人工智能不可或缺的重要组成部分,并代表着人工智能发展的未来之路”(Fan, et al,p156)。然而,当常识被视为通用人工智能的必要组成部分时,关于常识本身认知的不清晰必将带来关于常识表征的困惑便成为我们不得不面对的问题。退一步讲,即使关于常识的认知能够清晰,该如何确保其被有效表征?再退一步讲,如果其能被有效表征,此时的常识是否依然还是人类的实践智能?如此等等。因此,以实践智能中的常识为例,对通用人工智能之“通”的追寻似乎陷入一个怪圈——在某种意义上类似于“让上帝造一块他自己也搬不动的石头”那样。那么,是否真的如此呢?
虽然将通用人工智能作为人类对技术的一种向往充分体现了人类给予技术的一种构想式叙事,但是无论如何,构建具有人类智能的通用智能机器,就需要充分考虑人类智能与机器智能差异性与同构性。事实上,与假设的回形针最大化人工智能不同,人类智能并不以固定目标的优化为中心;相反,一个人的目标是通过先天需求和支持其智能的社会和文化环境的复杂整合而形成的。与回形针最大化的超级智能不同,智能的增加恰恰使我们能够更好地了解他人的意图以及我们自己行为的可能影响,并相应地修改这些行为。(参见Mitchell)因此,虽然在常识的模拟方面,通用人工智能之“通”以人类的常识为模板,但基于常识并非是人类解决所有问题的唯一能力,那么,把通用人工智能描绘为一种逻辑性地打开所有问题的神器同样显然也是不合理的。当常识被视为判别通用人工智能的重要依据时,是否意味着机器智能与人类智能的融合已经成为一种默认条件?
四、结论:作为人机共同体的通用人工智能之“通”
依据王培和戈策尔的观点,“任何特定的机器学习程序,如果被视为一个整体系统,如果在没有具体的人的介入的情况下进行输入并产生输出,那么它只能解决非常专业的问题”(参见Goertzel & Wang, p2)。因此,通用人工智能之“通”离不开人的维度,特别是在基于通用性与人的实践智能紧密相关的意义上,最起码作为输入环节的人是不可或缺的。 没有人的介入,程序所输出的结果将很难与构建通用人工智能的初衷相契合,进而,此处的“通”是建立在人机融合的意义之上的,即人机共同体模式。
与此同时,从关于通用人工智能发展前景的三种观点来看,第一种是“实现通用人工智能仅需要被证明具有更多的特定任务智能”(Roitblat,p280)。此处的“通”凸显了所完成任务的广泛性,但这种方式恰恰指出了专用人工智能走向通用人工智能的局限性。第二种是“通用智能不能由机器来完成,因为通用智能需要人类意识或者其他一些只有人类才具有的特有品质”(同上,p280)。此处的“通”直接指向了人机融合。虽然机器对人类知识的表征仍是通用人工智能发展的难点之一,但关于人类特质的考虑是通用人工智能与人类相媲美的一个要素。第三种是“通用人工智能虽然是可能的,但需要一些目前仍未出现却能被简要描绘的新发展”(同上,p288)。从这种关于通用人工智能草图的描绘来看,此处的“通” 恰恰指向了关于人的能力的全方位模拟。这种“通”是基于人机融合但通用人工智能需要创造其自身的新的表现形式,进而人机共同体模式的通用人工智能可能被超越,进入机器智能闭环的危险之境。而这也是人类关于通用人工智能风险的巨大担忧。
因此,从技术是为人类及其未来带来福祉的宗旨来看,通用人工智能之“通”应当以更有效、更便捷、更经济的方式进入人类,即人应处于环路。恰恰基于人类生存需要依赖技术,我们才更需要高度关注人的价值,警惕借技术之名走向技术的非人性化之旅。
参考文献:
维纳,2018年:《人有人的用处》,陈步译,商务印书馆。
Agüera yArcas,B& Norvig, P, 2023, “Artificial General Intelligence Is Already Here”, URL=.
Collins,H,2018, Artifictional Intelligence Against Humanitys Surrender to Computers, Cambridge:Polity Press.
Fan, L, Xu, M, Cao, Z, Zhu, Y, and Zhu, S,2022,“Artificial Social Intelligence: A Comparative and Holistic View”,in CAAI Artificial Intelligence Research 2(1).
Gavrilenko,A,& Morozova,K, 2020,“Machine Common Sense”,in ArXiv eprints, vol2006,URL=.
Goertzel, B & Pennachin, C (eds), 2007,Artificial General Intelligence, New York:Springer.
Goertzel, B& Wang, P,2007, Advances in Artificial General Intelligence Concepts, Architectures and Algorithms?: Proceedings of the AGI Workshop 2006, Washington: IOS Press.
Gunning, D, 2018,“Machine Common Sense Concept Paper”,in ArXiv eprints, vol1810,URL=.
Mitchell, M,2024,“Debates on the Nature of Artificial General Intelligence”, in Science 6689(383).
Morris, M R, Sohldickstein, J, Fiedel, N, Warkentin, T, Dafoe, A, Faust, A,Farabet, C, and Legg,S,2024, “Position:Levels of AGI for Operationalizing Progress on the Path to AGI”, in ArXiv eprints, vol2311, URL=.
Müller, V C,2021, Philosophy and Theory of Artificial Intelligence 2021,Berlin: Springer.
Roitblat, H, 2020, Algorithms Are Not Enough?: Creating General Artificial Intelligence,Cambridge: The MIT Press.
Sternberg, R J, 1985, Beyond IQ: A Triarchic Theory of Human Intelligence, New York: Cambridge University Press.
Suleyman, M& Bhaskar, M,2023, The Coming Wave:Technology,Power,and the 21st Centurys Greatest Dilemma,Crown Publishing.
Turing, AM, 1950, “Computing Machinery and Intelligence”, in Mind 236(59).
【本文系教育部哲学社会科学研究重大课题攻关项目“数字化未来与数据伦理的哲学基础研究”(编号23JZD005)的阶段性成果。】