一个领域的表示方式,在很大程度上,决定了那个领域是怎样被理解
作者:未知 文章ID:73024 浏览:
【原文】
材料一:
一个领域的表示方式,在很大程度上,决定了那个领域是怎样被“理解”的。只有当一个程序中的数学知识是包含于广博的现实经验之中的时候,或许才能被我们认为是以与我们同样的方式在“理解”。正是这个“知识表示”问题成了人工智能的关键所在。
在开始的时候,人们认为知识是像句子那样一“包”一“包”地存在的,而且把知识注入系统的最好方式就是找到一种简单的方式把事实翻译成被动的小数据包。那样每个事实可能只不过是一条数据,可以被使用它的程序所存取。这种想法被下棋程序所证实,在这些程序里棋局势被编码在某种矩阵或列表之中,高效地存在存储器里,可以把它们提取出来并用子程序加以处理。
心理学家早就知道,人类是以某种更为复杂的方式来储存事实的。但这一点只是近来才被人工智能研究工作者所重新发现。他们目前正而临着“组块化”知识的问题和区别过程性与描述性知识的问题。而后一个问題,涉及到“内省可达的”和“内省不可达的”这样两类知识间的区别。
认为所有知识都应能被编码成被动的数据,这种朴素设想实上是与关于计算机设计的大部分基本事实相矛盾的。这就是说,关于怎样加、怎样减、怎样乘等等的知识不是编码在中并存在存储器内的。事实上,这些知识不是放在存储器中的某个地方,而是体现在硬件的线路里。一个袖珍计算器并没有在其存储器中存放加法的做法,这个知识是编码在它的“内脏”中的。如果有人说:“请指给我看在这个机器中加法的做法存在哪里!”那么这种地方是找不到的。
但在人工智能中大的工件都是与这样一些系统有关的:它们大部分知识都存放在特定的地点一一也就是采用描述性的方式。当然,某些知识必须嵌入在程序中,否则的话,所得到的就根本不是一个程序,仅仅是一部百科全书了。问题在于怎样オ能把知识分成程序和数据。不管怎么说,把程序和数据区分开也并非总是轻而易举的。但在一个系统的开发过程中,如果程序员直观地感到某些项应当是数据(或程序),那将对该系统的结构产生相当大的影响,因为人编程序的时候总是倾向于把那些像数据的对象和那些像数据的对象区分开。必须指出,原则上把信息编成数据结构成或过程的任何方式都是同样好的,也就是说如果你不太在意效率的话,你能用一种方式所做的一切也都能用另一种方式来做。但是,可以提出一些理由来说明一种方式似乎肯定比另一种优越。例如,请考虑下面主张只使用过程性表示的点:“一旦你想要把相当复杂的特性编码在数据中,你就不得不开发出相当于一种新的语言或新的形式系统的东西。因此实际上你的数据结构变得像程序,而你的一些程序成了它们的解释程序,那你还不如开始就直接把这些信息表示成过程的形式,这就用不着外层的解释程序了。”
(摘编自(美)侯世达《哥德尔、艾舍尔、巴赫——集异璧之大成》)
材料二:
如何才能让计算机(或深度学习)具备理解与思考能力呢?我们应当参考人脑的工作模式以自然语言理解为例,当人们看到一句话“这个夏天就像蒸笼一样",会产生哪些理解呢?假如此人母语是英语,且并不懂汉语,如果我们给他一本中英文词典和语法书(注意这代表某种类型的语言知识),则他可以借助这些语言知识,很客易地将这个结构简的句子翻译成英语;此人还需要利用已有的常识知识和认知知识,才能理解将“夏天”比作”蒸笼“,是形容这个夏天很热;如果此人掌一些关于现实的世界知识,则他还会想到用某些品牌的空调或风扇帮助降温;如果此人还有一些全领城的行业知识,对他就能推测这个夏天空调大卖,空调厂商效益提升,可以提前做投资布局。
即使现有自然语言处理服务可以处理的简单样例,同样面临类似的问题。如,用户检索“北京到上海的高铁”时,商业搜索引擎可以匹配“北京”"上海”“高铁”等实体,匹配预先定义好的模板,然后根据该模板对应指令查询后台数库返回相关车次信息。这像一个事先编排好的操作流程,一切按照剧本来运行,一旦超出事先定义的范围就束手无策。而人类看到“北京到上海的高铁”,则会调动各种类型的知识来实现对这句话的理解,会知道北京和上海是中国的两大直辖市,高铁是运行在陆地上的高速铁路,京沪高铁是连接北京和上海的最繁忙的铁路线。人类永远这无法像搜索引那样记住繁多的京沪高铁车次,却能够利用有生以来不断积累的知识,轻而举地理解这的话在现实世界中的意义,而不仅仅用来找到所有京沪高铁车次而已。只有真正理解这句话在现实世界中的全部意义,才是真正的智能;而专门为完成某种特定任务(搜索车次)研制的系统或算法,则无法做到随机应变。
可以看到,即使短短的一向话,只有在各种类型知识的支持下,人们才能进行不同层次的理解。这些知识是人类对包括自身在内的外部世界的认知,如同Plam发明人杰夫.霍金斯在他的On Intelligence中所描述的“世界模型”,是人脑对这个世界形成的理性认知模型。只有将自然语言置入这个“世界模型”中,才能实现真正的理解。
(摘编自刘知远、韩旭、孙茂松《知识图谱与深度学习》)
【问题】
1.下列对材料相关内容的理解和分析,正确的一项是( )
A.“知识表示”是人工智能的关键所在,只有当程序中的数学知识包含于现实经验时,人工智能才真正得以实现。
B.信息被编码成数据结构或过程的方式本无优劣之分,程序员编码时对程序和数据直观的区分让它们有了高下之别。
C.专门为完成某种特定任务研制的系统或算法缺乏各种类型知识的支持,无法形成对外部世界的认知,不能做到随机应变。
D.下棋程序和商业搜索引擎均是将信息编码在程序中,高效率存储、匹配和提取,体现了人工智能的发展方向。
2.根据材料内容,下列说法不正确的一项是( )
A.实现真正的人工智能,首先需要解决知识编码由描述性向过程性的转变问题,但这一转变并非轻而易举。
B.计算机设计中的加、减、乘、除等知识是以程序的形式呈现的,这与人工智能研究工作者的最初理解不同。
C.人们借助各种类型的知识,可以对“这个夏天就像笼一样”这句话进行翻译、理解,甚至提前布局市场投资
D.人类与系统的不同之处在于人类能理解信息在现实世界中的全部意义,系统却只能存储多的信息。
3.根据材料内容,下列各项中不能体现“真正的智能”随机应变特征的一项是( )
A.智能人脸识别系统B.智能自动驾驶汽车
C.智能军事机械狗D.智能聊天机器人
4.请结合材料内容,给“知识表示”下一个简要定义。
5.请简要梳理材料一的行文脉络。
【参考答案】
1.C
2.D
3.A
4.知识表示是指通过程序或结构形式,将自然语言置于人脑对世界的理性认知模型中,进而实现认知现实世界。
5.首先引出话题,指出“知识表示”问题是人工智能的关键,接着阐述知识表示由数据向程序的发展变化,最后指出信息编码成程序的优越性。