计算机的确擅长进行文字处理,计算机真的能够理解它所处理的文字吗?
在今年的第49届国际计算语言学学会年会(ALC)上,麻省理工大学里贾纳·巴尔齐莱(Regina Barzilay)实验室的研究生布朗拿万(Branavan )和大卫·希尔福(David Silver)提出了一种解决这个复杂问题的思路:教计算机玩“文明”游戏。
“文明”游戏截图
来源:gizmag
“文明”是一款回合制战略游戏,玩家需要在人类文明的进程中将城市建造成帝国。研究人员增强了人工智能系统,使之能够学会玩家用的游戏攻略手册。布朗拿万介绍说,这款游戏知识人工智能技术的测试平台,因为该人工智能系统极其复杂。游戏中的每一个动作并没有一个预期的结果,因为比赛的对手可以对你的行为随意作出反应,所以需要一种技术来解决在这种随机的方式中潜在的复杂问题。
此外,该游戏攻略手册是一个开放的文本,里面没有如何取胜的详细步骤,只是一些一般性的建议。你必须自己弄清楚许多事情。对手册的理解格外重要。
该人工智能系统的出色之处在于,在系统开始运行时它并没有事先存入有关将要完成的任务的信息和编写指令的语言。它所能做的只有左键点击、右键点击、移动鼠标等动作,还可以访问屏幕上出现的信息。此外,它还具有对是否成功的判断标准,比如软件是否安装成功、是否赢得了游戏。但是它并不能理解动作与指令的对应关系和游戏中物体的真实含义。
最初,它的行为几乎是完全随机的,但随着它的不同行动,屏幕上出现了不同的词汇。它可以在指南中查找这些词汇,也可以进行关联词的搜索,建立词汇与动作一一对应关系的假设。能够导致好结果的假设被赋予较高优先级,导致坏结果的词逐渐被舍弃。这一过程跟人或动物习得行为和知识的过程非常相似。
测试发现,在安装软件的过程中,该系统能够将人读同样指令采取的步骤重现80%。在电脑游戏中,该系统获胜的几率为79%,比相同系统但未提供攻略的一组高出72%,比进行额外扩展以提高表现但未提供攻略的一组高27%。
尽管一些与会者认为对照组应该采取更加先进的人工智能学习系统,这样也许能够使结果更具说服力。但对于研究者们来说能否从手册中提取到有用的信息才是最重要的。这一点已经得到证实。他们表示会进一步改进算法,使系统表现更卓越。
巴尔齐莱和布朗拿万表示,在短期内,可用该技术进行自动算法设计,设计出比人亲手设计的算法表现得更好的算法。这项技术再经完善,便可与智能机器人技术相结合,促使研发出有更强学习能力和理解力的智能机器人。