网站首页 | 网站地图

大国新村
首页 > 学术前沿 > 成果首发 > 正文

从认知科学看人工智能的未来发展

【摘要】乔姆斯基的生成转换语法(GT语法)是语言学革命和认知科学革命的基础,今天它又成为ChatGPT的理论依据。从GT语法到ChatGPT,人工智能到底走了多远?从乔姆斯基GT语法分析和语言认知入手,我们重新认识乔姆斯基语言学革命的意义,揭示人工智能与人类心智之间的紧密关联、依存关系和发展动力。认知科学的建立使我们有可能从多学科综合的高度来理解人类心智与人工智能。在此基础上,我们以ChatGPT为例,分析这款人工智能软件的利弊得失及其所造成的困惑,提出“人工智能不能做什么”这个终极问题,并尝试给出我们的回答。人工智能就是人类所建造的非人类的智能,它不过是对人类心智的模仿。人工智能与人类心智的差别,本质在于高阶认知(人类认知),在于语言认知及其基础之上的思维认知和文化认知。人工智能今后的发展必然是体现语言驱动的、语言、思维和文化层级的人类心智和认知特征的新一代人工智能。语言认知、思维认知和文化认知将在未来的人工智能发展中扮演重要角色。
【关键词】人类心智 人工智能 乔姆斯基 GT语法 ChatGPT
【中图分类号】TB18 【文献标识码】A
【DOI】10.16619/j.cnki.rmltxsqy.2023.14.002

【作者简介】蔡曙山,清华大学社会科学学院心理学系教授、博导,清华大学心理学与认知科学研究中心主任。研究方向为语言学、逻辑学、心理学和认知科学。主要著作有《认知科学导论》、《自然语言形式理论研究》、《语言、逻辑与认知》、《言语行为和语用逻辑》、《聚合四大科技 提高人类能力:纳米技术、生物技术、信息技术和认知科学》(译著)等。

 

人工智能近年来的发展颇有些令人眼花缭乱,从AlphaGo、通用人工智能和生命3.0到ChatGPT,等等,发展热潮一浪高过一浪。在这个过程中,一些人似乎忘记了人工智能的本质和定义——人工智能是人类创造的机器智能,是机器模仿人类心智所产生的智能。据此定义,我们不能仅就人工智能来说人工智能,而应该从人类心智来认识人工智能,也就是从认知科学来认识人工智能。

起源于20世纪50年代的人工智能与乔姆斯基语言学革命、计算机和信息技术革命以及认知科学革命息息相关。乔姆斯基领导了语言学、心理学、计算机科学领域的三场革命,这些革命又相继引发哲学、人类学和神经科学领域的革命。在这些革命的影响下,1975年前后,认知科学在美国建立,形成由语言学、心理学、哲学、人类学、计算机科学和神经科学6大学科构成的学科框架。2000年,科学家们将另一个与心智密切相关的学科——教育学纳入认知科学之中,形成“6+1”的学科框架。这些学科在认知科学框架下与认知科学交叉形成新兴学科:认知语言学、认知心理学、心智哲学、认知人类学、人工智能、认知神经科学和心智教育学。由此可见,人工智能本是认知科学题中之义,是计算机科学与认知科学交叉的产物,是人类赋予机器(计算机)的智能。

人工智能诞生以后,其与认知科学剪不断、理还乱的关系,始终是理解人工智能的关键点。一是因为五个层级的人类心智是人工智能的来源和基础,人工智能如何学习和模仿人类心智和认知能力,是人工智能过去、现在和未来发展的根据。二是作为人类心智和认知基础的语言,人工智能的发展又具有特殊的意义。当前的人工智能新宠ChatGPT就是一款体现了人工智能与认知科学结合的语言认知软件。

让我们从乔姆斯基的生成转换语法(GT语法)开始说起。

乔姆斯基和GT语法

我们先来认识语言学革命的发起人、认知科学的第一代领袖乔姆斯基(N. Chomsky, 1928-)的语言理论和语言认知方法。

什么是语言知识?什么是语言能力?人的语言能力是哪里来的,是先天遗传的还是后天习得的?人类如何加工语句,是经验主义的还是唯理主义的?自然语言和形式语言的联系和区别在哪里?形式语言和计算机语言的关系又是什么?人类如何通过自己的语言让计算机工作?什么是形式文法?乔姆斯基语言学革命的主要内容和理论贡献是什么?关于乔姆斯基和乔姆斯基的语言学革命,我们可以思考很多重要问题,这些问题至今仍有特别重要的意义。[1]

现在我们来看乔姆斯基的一个重要的语言学理论——生成转换语法(generative transformational grammar),简称GT语法。

乔姆斯基著述丰厚,其理论一直处在不断的变动之中。第一阶段从1950年代中期开始到1970年代中期,这个时期是生成转换语法的形成时期,这个时期的重要语言理论有50年代的句法结构理论(SS)、60年代的标准理论(ST)、70年代的扩展的标准理论(EST)和修正扩展的标准理论(REST),等等。第二阶段是1970年代以后,这个时期的重要理论包括管辖和约束理论(GB)、最简方案(MP),等等。其中,GB又包括短语结构的X-阶标理论(X-barT)、θ-理论(θ-T)和功能范畴(FC)、移动和格理论(MCT);MP又包括原则和参数理论(P&P),等等。

第一阶段的代表作是1957年的《句法结构》(Syntactic Structure, SS),这是乔姆斯基以博士论文为基础撰写的划时代著作,本书建立的生成转换语法是乔姆斯基语言学革命的标志,它由以下三个部分构成。

(1)短语结构规则(phrase structure rules)。短语结构规则也叫重写规则(rewriting rules)。它试图用有限的规则来生成无限的句子。重写规则通过形式化的方法和递归定义,生成一系列的短语结构。

(2)转换规则(transformational rules)。由重写规则生成一系列的短语结构,可分为词汇前结构(pre-lexical structure)和词汇后结构(post-lexical structure)。前者由非终端符构成,称为深层结构(deep structure),后者由终端符构成,称为表层结构(surface structure)。

(3)形态音位规则(morphophonemic rules)。按照乔姆斯基的理解,转换规则将深层结构的逻辑语法关系映射为表层结构的语言关系与语音关系。这样就可以解释语言的歧义和释义现象。歧义是两个不同的深层结构转换为同一表层结构,释义是同一深层结构转换为两个不同的表层结构。

乔姆斯基的生成转换语法(generative transformational grammar)由生成语法和转换语法两部分构成。我们先来看生成语法。

(一)生成语法。乔姆斯基在《句法结构》中,给出了如下的句法结构的一个简单例子。

(1)

 

我们将(1)中每一条形如X→Y的规则称为“重写规则”,即“重写X为Y”,并称这些规则的集合为一个语法。

我们称下面的(2)为语句“the man hit the ball”从语法(1)所得出的一个推导。

(2)

 

其中,最右边的一列给出得出该行符号串所依据的重写规则。例如,第二行的串“NP VP”是根据重写规则(i)得出的,如此等等。

这个推导可以用下面的树形图来表示:

11

 

注意这是一棵倒置的树,树根向上,树梢向下。不要小看这个简单的结构,这样一个简单的结构却表明了乔姆斯基语言学革命的开始。

乔姆斯基以前的经验主义语言学是从树梢开始来分析语言的,即从具体的语句开始,分析语句的结构,找出语句的共同特征,最后总结出一个语言的语法。行为主义语言学则认为人们的语言知识来源于语言的实践。乔姆斯基语言学革命把这个过程倒了过来,即把这棵树“倒”了过来。他认为,儿童并不是一个语句、一个语句地去习得第一语言知识的,而是相反。儿童具有一种先天的语言能力,语言习得的环境和条件只是激发儿童的这种能力,所以儿童才能够从一个结构生成无数多的语句。换句话说,乔姆斯基认为语言的这种结构和规则是先天存在于儿童的头脑之中的。语言是一种心智现象,这是乔姆斯基唯理主义和心理主义语言学的最本质的特征。

注意在语句的生成过程中,使用了很多短语(Phrase),乔姆斯基用范畴名称(categorial names)一一将其命名如下:

S:语句(Sentence)

NP:名词短语(Noun Phrase)

M:情态词(Modal)

VP:动词短语(Verb Phrase)

D:限定词(Determiner)

N:名词(Noun)

V:动词(Verb)

PP:介词短语(Prepositional Phrase)

P:介词(Preposition)

ADVP:副词短语(Adverbial Phrase)

ADV:副词(Adverb)

AP:形容词短语(Adjectival Phrase)

A:形容词(Adjective)

而这些短语也是具有结构的,可以用短语结构规则来刻画,其按照这些规则生成相应的短语。关于自然语言中最常用的是名词短语规则、动词短语规则、形容词和副词短语规则、时态和情态短语规则,等等。

(二)转换语法。为使语法和规则尽量简明,乔姆斯基的生成规则只负责解释直陈语句的生成,而将其他语句形式如否定句、疑问句、倒装句和短语成分的移动等的生成统统交给转换规则完成。下面是一些例子。

(1a)He can hit this ball(他能击中这个球)。

(1b)This ball, he can hit(这个球他能击中)。

两者的区别在于名词短语this ball的位置不同。在语句(1a)中,名词短语处于动词的宾语位置上,在这个位置上this ball充当了hit的宾语。在语句(1b)中,名词短语this ball在逻辑上仍然应该被理解为动词hit的宾语,但在语法上它的位置却处于句首,而不是及物动词的宾语的位置。

对语句(1b)中的这种不一致的可能的解释是:假设名词短语NP原来处于动词宾语的位置,后来却被转移到句首的位置上去了。我们可以用下面的推导式来对语句(1b)进行解释:

(2a)He can hit [NPthis ball] →

(2b)[NPthis ball], he can hit

由PS规则和词汇插入规则(Lexical Insertion Rule,简称LIR)生成的基本的表达式是(2a),而将某种具有不同性质的规则应用于基本表达时却将名词短语this ball从动词宾语的位置转移到句首位置上去了。我们把在上面的推导式中使用的转移规则称为转换规则(transformation rule)。在下面的两个树图中,转换规则将由PS规则和LIR生成的短语标记(3a)转变为稍稍不同的短语标记(3b)。

转换规则(transformation rule)有各种不同的类型。例如,我们把从语句(1a)转变为语句(1b)所使用的转换规则称为主题化(Topicalisation)规则,它的典型特征是把某一范畴移动到语句的最左端。主题化的转换规则可以用形式化的方式表达如下:

X- NP- X 结构描写(Structural Description)

1 2 3 →

2 1–t– 3 结构变换(Structural Change)

其中,结构描写(SD)用来表示按照PS规则和LIR生成的短语结构,它与基本表达式相一致。用NP来表示转换的目标范畴,X表示NP左右两边的范畴变元(可以为空)。数字用来帮助我们追溯所发生的语句变换。结构变换(SC)用来表示根据主题化规则导出的短语标记,即(3b)所示的导出表达式。从中可以看出,用数字2标示的目标名词短语NP已经被转移到句首的位置,它的原初位置(即在SD中所占据的位置)用符号t来代替。符号t意味着这个位置发生了短语结构的转移,从而留下了转移的轨迹(trace)。

22

 

以上形式规则可以用来说明所有类型的转换。当然,我们也可以用平常的语言来定义转换规则。

乔姆斯基的生成转换语法(GT语法)的意义重大:第一,这是历史上首次使用数学逻辑(mathematical logic)的分析方法来分析自然语言的句法结构,使20世纪的语言学从经验主义语言学进入到唯理主义语言学的发展阶段;第二,乔姆斯基的理论表明语言加工是自上而下的(top-down)而不是经验主义语言学自下而上的(bottom-up),这样我们就区分了语言能力和语言知识,并找到了“先天语言能力”(Innate Language Faculty, ILF)这把理解语言认知能力的钥匙;第三,乔姆斯基的形式化分析方法为自然语言理解奠定了基础,并成为人工智能的基本方法。乔姆斯基建立的句法结构理论、形式方法等理论方法从一开始就成为人工智能的基础理论和基本方法,今天仍然如此。本文稍后将作为案例分析的人工智能新宠——ChatGPT,正是根据乔姆斯基的GT语法演变而来的。

上一页 1 234下一页
[责任编辑:张 晓]