精通双语的“机器人秘书”


  亚利桑那大学卡内基梅隆大学的研究者们研究了一款机器人秘书Hala。让人惊喜的是,这位机器人秘书精通双语,并且还了解两种不同的文化。该机器有一张人脸和一个自然语言的界面。

  用计算机控制的Hala不仅可以翻译语言,还能分辨不同文化访问者之间的细微差别。

  里德•西蒙斯(Reid Simmons)是卡内基梅隆大学机器人研究所的教授,桑迪为•方(Sandiway Fong)是亚利桑那大学语言学和计算机科学的副教授,他们共同完成了该项目。卡内基梅隆大学提供机器人创新技术,而亚利桑那大学提供语言技术。

  Hala被内置了个人基本信息、个人过往故事和个性特色,以此鼓励人们和她交谈。并且她会针对来自访问者的提示调整回应,在整个交流的过程中建立一个用户模型:这个人地位很高吗?这个人是美国人吗?这个人很着急吗?

  方说,Hala目前的版本不仅能在英语和阿拉伯语之间转换,同时还有两种模式,可以辨认和处理潜在的文化模糊和误解。

  “你可能说阿拉伯语,但你可能选择用英语和机器人交谈。”方说,“你可能会用到一些阿拉伯世界的成语,也会流露出文化背景。这个机器人两方面的情况都得考虑到。”

  比如,“week after week”这个短语,在英语句子“I'm looking for the group that meets week after week”中意思是“每周”,但在一些阿拉伯方言里,这个短语可能意思是“每隔一周”。所以,只有机器人能够同时灵活的处理两种词典才能计算出这个短语是属于哪种文化,并且它会询问用户进行求证。

  文化不仅会影响交互过程的语法和语义,还能影响该交互过程的结构,从打招呼的方式和结尾辞到礼貌用语的形式。

  方雇佣了一个语言学研究生萨曼莎•瑞(Samantha Wray),瑞主要负责创建一个问题数据库来训练机器人Hala。

  大部分自然语言分析程序——计算机翻译器核查正确的语法——在一个叫做“树图语法关系库”(Treebank corpora)上进行训练,或者在剖析过的句子上进行训练,这些句子通常来自新闻电讯中的内容。但是,新闻故事不会总包含问题、问候或者对话。瑞从阿拉伯语电视网半岛电视台上找到了访谈的脚本,这些都可以进行数据挖掘用作语料库的补充。研究者们对这些数据进行图表注释、语法分析和概括总结,这样可以“教”Hala如何理解人们输入的阿拉伯语和英语。

  这项工作在其他人机交互系统中的应用研究也在紧张进行中。方认为,该技术可以适用于计算机帮助系统、多文化信息台、旅游指南和自动国际通话中心等领域。“我们可以预见到,机器人将为不同文化的人之间搭起桥梁,扮演中间人的角色,可以让人们更自然高效的彼此交流。”

  “这对桑迪为在该领域的工作是一次极大的肯定,也是一次很好的机会来展示我们在计算机语言和人类语言技术方面的巨大进步。”迈克尔•哈蒙德(Michael Hammond)说。他是亚利桑那大学语言学部门的主管。