世界科技

世界科技
您的位置是:首页 > 文章精选 > 咨讯

咨讯

发布时间:2014-07-22

阿兰·图灵。他提出的"图灵测试"在人工智能学界引起了广泛的争论


尽管可以给计算机灌输大量的知识,但是这与人类的学习能力还有很大的差距

今年6月8日,英国雷丁大学的几位研究人员宣称,"尤金·古斯特曼"软件通过了图灵测试,并称其为人工智能领域的一个"里程碑"事件。随后,一些媒体也按照"里程碑"的意义纷纷
报道了这件事,但是引起很多人的疑问。为此,我们请教了中国科学院数学与系统科学研究院的陆汝钤院士等几位研究人员。
记者/闫凯
陆汝钤:1959年毕业于德国耶拿大学数学系。中国科学院数学与系统科学研究院研究员、博士生导师、中国科学院院士。在人工智能、知识工程和基于知识的软件工程方面作了系统的、创造性的工作,是我国该领域研究的开拓者之一。
张松懋:1992年在中科院数学所获得博士学位,研究方向为计算机科学中的人工智能理论和技术,主要研究内容包括语义网和本体、全过程计算机辅助动画自动生成、故事理解、关联规则挖掘等。
曹存根:1993年从中科院数学所获得博士学位,1998年入选中科院百人计划,2010年起担任中科院计算所研究员、博士生导师。长期从事文本知识获取和常识知识获取研究,所研制的智能问答机器人和大规模知识管理系统,已经被广泛使用。
背景介绍
2014年6月8日,英国雷丁大学(University of Reading)的研究人员宣布,一台超级电脑上的名为"尤金·古斯特曼"(Eugene Goostman)的软件通过了他们组织的"图灵测试",这件事堪称"人工智能学史上的里程碑"。"尤金"模仿一名13岁的、以英语为第二语言的乌克兰男孩,在测试中成功地以33%的比例骗过了30名评委。按照测试规则,测试者通过键盘与被测试者(包括一台电脑和一个人)交流5分钟,如果计算机让测试者误认为它是人的比例超过了30%,就意味着计算机通过了图灵测试。在这次比赛中,一共有5台超级电脑参加。人工智能软件"尤金"荣获这次比赛的第一名。】
测试结论是否靠谱?
科学世界:在人工智能(AI)学界来看,英国研究者所称的"尤金软件通过了图灵测试"这件事,真的具有"里程碑"意义吗?
陆汝钤:我个人感觉这种说法是不对的。他们作的这个结论并不符合图灵的原意。
图灵原来写的那篇文章说:如果一个人(测试者)和看不见的另外一个人以及计算机对话,持续5分钟,人不被计算机蒙骗的机会不超过70%,也就是说,计算机能够骗人的概率不低于30%,则可以认为计算机是能思维的。这种测试被后人称为图灵测试。
图灵原文中提到的"机会",是指从大量的测试样本事例中得到的统计平均值,所以,绝不可能只通过一次或者几十次实验,就说超过了图灵测试中提到的概率。
这次英国人做的测试中,有30个裁判同时对计算机进行测试。对于统计出一个事件的概率来说,30个事例还是远远不够的。一般来讲,当有趋近于无穷多个事件的时候,才会出现一个可靠的概率值。除了评委数量很有限以外,他们所能提的问题也是很有限的。
张松懋:测试者已知自己面对的是一个人和一个机器,他对这个测试以及AI技术的了解程度,都会对测试结果有很大的影响。我看过这次比赛中获得第一的"尤金"软件和一名媒体记者在网上公开的对话记录。研究AI的人可以看出来,"尤金"的回答都是机器说的话。而如果是对AI技术了解很少的人来看,也许就会判断错误。
从图灵的原意上看,被测试的计算机要骗测试者认为"它是人",被测试的人是反对计算机的,他要努力向测试者证明"不对,它是一台计算机"。
陆汝钤:这个情景就像《西游记》里面的"真假美猴王"的故事。两个"孙悟空"都要向菩萨证明自己才是真的。
科学世界:图灵所说的"人不被计算机蒙骗的机会不超过70%",是不是可以等价于"人被计算机蒙骗的概率超过30%"呢?
陆汝钤:这种理解不完全对。"人类裁判取胜的机会不超过70%",应该等价于"计算机取胜的机会不低于30%"。这次比赛中,人类裁判被计算机骗过的比例达到了33%,所以英国的研究者就说"尤金"软件通过了图灵测试。照这种说法,如果只有1个裁判参加测试,他被计算机蒙住的话,是不是就要说计算机百分之百地赢了呢?


附件: