图灵测试

人工智能测试
(重定向自图灵实验

图灵测试(英语:Turing test)是英国计算机科学家艾伦·图灵于1950年提出的思想实验,图灵亦将其称为“模仿游戏”(imitation game),这个实验的流程是由一位询问者写下自己的问题,随后将问题发送给在另一个房间中的一个人与一台机器,由询问者根据他们所作的回答来判断哪一个是真人,哪一个是机器,所有测试者都会被单独分开,对话以纯文本形式透过屏幕传输,因此结果不取决于机器的语音能力,这个测试意在探求机器能否模仿出与人类相同或无法区分的智能[1]

图灵测试一个标准的模式:C使用问题来判断A或B是人类还是机械

图灵测试是图灵在他的论文《计算机器与智能英语Computing Machinery and Intelligence》中提出的,这篇论文于1950年10月发表于哲学期刊《心灵》中[2],图灵在这篇论文中探讨了“机器能够思考吗”这一问题[1],图灵测试产生了很大的影响力,同时也遭到诸多批评,它亦成为人工智能哲学中的一个重要概念[3][4][5]

历史

编辑

机器能否思考这个问题历史悠久,这是二元并存理念唯物论思想之间的区别。笛卡尔在1637年《谈谈方法》中预言了图灵测试。

笛卡尔指出,机器能够与人类交互,但认为这样的机器不能作出适当的反应,但是任何人都可以。因此,笛卡尔借此区分机器与人类。笛卡尔没有考虑到机器语言能力未来能够被克服。

狄德罗对于图灵测试的标准:

如果他们发现一只鹦鹉可以回答一切问题,我会毫不犹豫宣布它存在智慧。
— 狄德罗, Pensées philosophiques, Texte établi par J. Assézat et M. Tourneux, Garnier, I (p. 127-155).[注 1]

这并不意味着他同意这一点,但它已经是唯物主义者当时普遍的说法。

根据二元论者心态,心灵是非物理物质(最起码具有非物理性),因此不能以纯物理来解释。而根据唯物主义,头脑可以用物理解释,这提供了人工智能产生的可能性。

1936年,哲学家阿尔弗雷德·艾耶尔思考心灵哲学问题:我们怎么知道其他人曾有同样的体验。在《语言,真理与逻辑》中,艾尔建议区别有意识的人类及无意识的机器。

1956年达特茅斯会议之前,英国研究者已经在机器人工智能研究领域探索了十几年。比率俱乐部是一个非正式的英国控制论和电子产品研究团体,成员包括艾伦·图灵

1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。[6]由于注意到“智慧”这一概念难以确切定义,他提出了著名的图灵测试:如果一台机器能够与人类展开对话(透过电传设备)而不被辨别出其机器身份,那么称这台机器具有智慧。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。论文中还回答了对这一假说的各种常见质疑。[7]图灵测试是人工智能哲学方面首个严肃的提案。

2014年6月8日,首次有电脑通过图灵测试,尤金·古斯特曼成功在雷丁大学所举办的测试中骗过研究人员,令他们以为“它”是一个名为尤金·古斯特曼的13岁男孩[8],但后来有文章指出它其实并没有真正通过测试[9]

2023年7月25日,Nature刊登新闻指出ChatGPT已经能突破图灵测试,并建议寻求新的人工智能评估方法[10]

测试内容

编辑

如果一个人(代号C)使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。对象为:一个是正常思维的人(代号B)、一个是机器(代号A)。如果经过若干询问以后,C不能得出实质的区别来分辨A与B的不同,则此机器A通过图灵测试。

完成图灵测试涉及的技术课题

编辑

根据人们的大体判断,达成能够通过图灵测试的技术涉及以下课题[11]

但是为了通过完全图灵测试,还需要另外两项额外技术课题:

图灵测试的变种

编辑

许多其他版本的图灵测试,包括上文所阐述的,已经经过多年的酝酿。

反向图灵测试和验证码

编辑

验证码(CAPTCHA)是一种反向图灵测试。在网站上执行一些操作前,用户被给予一个扭曲的图形,并要求用户输入图中的字母或数字。这是为了防止网站被自动化系统滥用。理由是能够精细地阅读和准确地重现扭曲的形象的系统并不存在(或不提供给普通用户),所以能够做到这一点的任何系统可能是个人类。

可以破解验证码的软件正在积极开发,软件拥有一个有一定准确性的验证码分析模式生成引擎。[12]而在破解验证码软件被积极开发的同时,另一种通过反向图灵测试的准则也被提出来。其认为即使破解验证码软件被成功研发,也只是具有智能的人类透过编程对验证码所作出的破解手段而已,并非真正通过反向图灵测试或图灵测试。而如果一台机器能够规划出如同验证码一类的防止自动化系统的规避程序,此台机器才算是真正通过了反向图灵测试。

完全图灵测试

编辑

普通的图灵测试一般避免审问者与被测试计算机发生物理上的互动,因为物理上模拟人(比如像模拟人的外表)并不是人工智能的研究范畴。然而一些人工智能可能涉及一些人机在物理上的交互,所以人们又拓展出了“完全图灵测试”。[13]在完全图灵测试中,可以包含必要的人机在物理层面上的交互。但是为了通过完全图灵测试,还需要在普通图灵测试之外另外两项额外技术课题。询问者还可以测试受试者的感知能力(需要电脑视觉),和受试者操纵物体的能力(需要机器人学)。[14]

参见

编辑

参考文献

编辑
  1. ^ 1.0 1.1 TURING, A. M. I.—COMPUTING MACHINERY AND INTELLIGENCE. Mind. 1950-10-01, LIX (236). ISSN 1460-2113. doi:10.1093/mind/lix.236.433. 
  2. ^ Isaacson, Walter. The Innovators: How a Group of Hackers, Geniuses, and Geeks Created the Digital Revolution. Simon & Schuster. 2014. ISBN 1-4767-0869-X. 
  3. ^ Pinar Saygin, Ayse; Cicekli, Ilyas; Akman, Varol. Turing Test: 50 Years Later. Minds and Machines. 2000-11-01, 10 (4). ISSN 1572-8641. doi:10.1023/A:1011288000451 (英语). 
  4. ^ Artificial Intelligence: A Modern Approach, 4th US ed.. aima.cs.berkeley.edu. [2024-01-07]. (原始内容存档于2011-02-28). 
  5. ^ Świechowski, Maciej. Game AI Competitions: Motivation for the Imitation Game-Playing Competition. Annals of Computer Science and Information Systems. 2020, 21 [2024-01-07]. ISBN 978-83-955416-7-4. doi:10.15439/2020f126. (原始内容存档于2024-06-12) (英语). 
  6. ^ McCorduck 2004,第70−72页, Crevier 1993,第22−25页, Russell & Norvig 2003,第2−3 and 948页, Haugeland 1985,第6−9页, Cordeschi 2002,第170–176页. See also Turing 1950
  7. ^ Norvig & Russell (2003,第948页) claim that Turing answered all the major objections to AI that have been offered in the years since the paper appeared.
  8. ^ 存档副本. [2014-06-09]. (原始内容存档于2014-06-09). 
  9. ^ 存档副本. [2014-06-10]. (原始内容存档于2014-06-10). 
  10. ^ Biever, Celeste. ChatGPT broke the Turing test — the race is on for new ways to assess AI. Nature. 2023-07-25, 619 (7971) [2023-08-03]. doi:10.1038/d41586-023-02361-7. (原始内容存档于2023-07-26) (英语). 
  11. ^ Russell, Stuart; Norvig, Peter. Introduction. Artificial Intelligence: A Modern Approach. Upper Saddle River, New Jersey: Pearson Education, Inc. 2010: 2 [2011-01-30]. ISBN 978-0-13-604259-4. 
  12. ^ Malik, Jitendra; Mori, Greg, Breaking a Visual CAPTCHA, [2013-09-22], (原始内容存档于2019-03-23) 
  13. ^ Oppy, Graham & Dowe, David (2011) The Turing Test页面存档备份,存于互联网档案馆). Stanford Encyclopedia of Philosophy.
  14. ^ Russell & Norvig 2010,第3页.

注解

编辑
  1. ^ 法文:s'il se trouvait un perroquet qui répondît à tout, je prononcerais sans balancer que c'est un être pensant

外部链接

编辑