英文主站

搜索网站

Print

人与机器:何谓智能



撰文Catherine Norwood

 

2012 年 11 月,位于美国田纳西州的全球最强大的超级计算机被正式命名为“泰坦”。它每秒的运算速度达千万亿——是 20 年前计算机运算速度的 176,000 倍。

但泰坦真的比其先辈更加聪明吗?人工智能领域的研究人员表示,这一点还有待观察。

在墨尔本蒙纳士大学工作的 David Dowe 副教授参与了一项开发全时通用智能(anYnt)测试的国际合作,其目标是衡量人工智能的进展。这是全球首个全时通用智能(anYnt)测试。

Dowe 副教授表示,这项工作的核心是确定什么是智能,即测试中到底想要衡量什么?尽管研究人员仍在尝试解答这个问题,他们认为识别和响应模型的能力是一项关键因素。

有证据表明,机器在完成某些特定任务方面正变得更加聪明。1997 年,IBM 的“深蓝”计算机在一场人机大战中击败了国际象棋世界冠军卡斯帕罗夫 (Garry Kasparov)。2011 年,IBM 的“沃森”计算机在美国智力问答节目《Jeopardy!》中对阵两位人类冠军,最终获得胜利。但在涉及到测量普通智力和适应陌生情况的能力时,机器的进步就没有那么明显。

Dowe 副教授表示:“我们尝试提出一些适用于每个人和每样东西的衡量标准——不论是机器、人类、动物还是它们的混合体,甚至是来自其它星球的实体存在物。也可以是这些物体的任意组合,例如一个人、一支笔和一张纸的组合;正在使用电脑的人;这样的一个团体或社群,如正在共同解决问题的两个人。”

Dowe 副教授的主要研究领域是机器学习和统计建模,主要利用最小信息长度(MML)进行研究,蒙纳士大学教授 Chris Wallace 和 Dowe 副教授于 1968 年联合开发了该方法,当时他担任信息科学系的基础教授兼系主任。MML 能识别数据中最有效的模型,让信息能够尽可能被压缩成研究人员所说的两部分信息。第一部分描述最理想的模型情况,第二部分传达该模型的“杂讯”和变化。

根据其在 MML 方面的研究,Dowe 副教授提出,模型识别是智能的核心元素;其它因素包括记忆存储、数学能力和计划能力。

“你会观察周围世界的模型,并且使用这些模型来响应世界,这些模型可能是面部识别,或食物味道。有时,这些模型经过他人的学习再传递给我们。至于其它的模型,则需要我们自己来识别。”

 

智能的模型

上世纪 90 年代,几乎在同一时间,西班牙的研究人员——瓦伦西亚理工大学(Technical University of Valencia)的 José Hernández-Orallo 博士也在独立进行与 Dowe 工作相同的理论研究。他使用算法信息论和 MML 来衡量智能,前者是上世纪 60 年代由美国科学家 Ray Solomonoff 率先提出的理论。

Hernández-Orallo 博士称,量化进步的能力是任何一门学科的核心,开发人工智能的初衷亦是如此。从 2004 年开始,两人便开始一起寻找衡量智能的方法,但他们的研究直到 2010 年西班牙教育和科学部拨款帮助其深入开展 anYnt 测试之后才取得了较大进展。

该测试尝试尽可能消除人为偏见。它有点像电脑游戏,参与测试的人或者计算机必须累计奖励并避免惩罚。

这就需要找出游戏中带来奖励的“好”元素活动的模型,和带来惩罚的“坏”元素所代表的模型。

受试者还要找出哪一种元素为“好”,哪一种为“坏”。受试者累计的奖励越多,越能清晰表现出其识别模型和计划自身行动的能力。

使用奖励和惩罚是为了消除测试中语言的复杂性,确保其不仅适用于人类,也能适用于机器,甚至是任何一种动物。

初步测试的对象是一些西班牙大学生和一款相对简单的计算机学习程序—— Q-learning,随后研究人员对原型进行了改进。Dowe 副教授称,尽管学生明显更具智能,但测试结果却显示计算机系统和学生的智能相当。

尽管这表明要找出一种最终测试方法还有很长的一段路要走,但开发这个首创测试的过程有助于明确细化的关键问题。测试传达给受试者的方式是其中的关键,尤其是在研究对象扩大到动物身上时(动物大都不会使用键盘)。研究人员还计划提高测试的适用范围,根据受试者的表现来提高或降低难度。

Hernández-Orallo 博士说道:“这里还有很多地方有待探索。今天的人工智能比二三十年前更出色、更实用。它可以处理更多的工作,但它真的更加智能吗?我们缺少确切的科学依据,因此难以回答这个问题。但我们正在努力。”

浏览 anYnt 项目网站:http://users.dsic.upv.es/proy/anynt

蒙纳士社交媒体

蒙纳士社交媒体

      

关注蒙纳士官方微信:MonashUniAus