各位晚上好:
我很荣幸获得这个奖项。
当我们说到获奖感言的时候,首先要了解一个概念:感言到底在感什么?我可不可以说,感言所感都发生在获奖之前?每个作者都有和自己作品相处的故事,都有他对事物的独到见解,但不幸的是只有获奖这位才有机会把这些东西说出来。
既然支撑获奖感言的想法都出自获奖前,那肯定能在获奖之前就写出获奖感言。更进一步,依靠获奖感言来获奖又有什么问题呢?这篇演讲就这么出生了,它既是我得奖之后的感言,也是让我得奖的文章。
我早就预测自己会获奖。我只是遵循了人工智能的预测而已。
我是计算机专业,研究自然语言处理,就是用所谓的人工智能分析人说的大白话。我们人类能够互相理解,但自然语言充满各种歧义和错误,对计算机这种认死理的东西来说就十分困难,于是这些年来大家让神经网络去分析语言。前年开始,打给你们的推销电话就可能不是真人了,是靠神经网络猜测某些句子该如何回应。你们下次可以试试,突然问对方穿的是不是拖鞋,看对面的业务员会不会突然死机。
我不想叫这些东西人工智能,它们没有什么智能,只是一些统计特定格式数据的神经网络。神经网络里有大量神经元,每个神经元接收数字,做一点运算交给下一个神经元。很多年以前,结构简单的神经网络识别笔画潦草的手写数字字母,准确率就已经高于人类,在各大银行发挥作用。
我导师是领域内大牛,但他最近几年只接一些横向项目,不再搞研究了。他总是让我照搬别人论文写出代码,再把软件卖给公司,说是产学研结合。他每级有好几十个学生,天天出差演讲,我什么新东西也没学到。自从那个演员一出名,毕业论文审查严格很多,我只能自己摸索点小课题应付毕业。
我一开始只想做点简单的东西写出论文,比如判断两篇文章是否类似,用在小说网站的推荐功能上。这题目老得不能再老了,我只需找几个别人设计的网络结构,改得复杂一些。就像拿神经元盖楼,从多个设计师那里抄来不同的楼层。只要训练后结果还说得过去,我就可以安心去找公司实习了。
Github你们了解吗?是全球程序员把自己代码无偿公布的地方。我有天在Github搜能用的代码,就看到了那个奇怪的神经网络。我一开始只想抄一个最简单的分类网络,然后我见到了它,“通用判别器”,当时我还不知道通用指的是什么。
上传者头像是42,我觉得和在座的各位一样是喜欢科幻的自己人,就仔细看了看。介绍文档很含糊,说能判断两段文字的相关概率值。这个“通用判别器”,它没说明任何训练用的数据来源,只是一堆预训练好的神经元。因为它很小巧,又并不需要我从零开始搭建没用过的开发环境,我就下载了。当我第二次访问GitHub时,我再也找不到原始项目了。就连克隆到自己账号下的那份也消失了。
我测试了样例,发现它真的能把两句描述相同对象的句子判断为90%以上的相关性,不相关的就只能输出5%以下的数字。
我尝试改动神经元权重,结果整个网络完全丧失了处理能力,对于所有测试都给出几乎随机数回答。常理来讲,神经网络在数学上是可导的,我的微调可能让网络丧失一点点给出准确概率的能力,但不至于让它变成疯子。我只能猜测,之前的网络达到了某种极难发现的最优解:比如我们想找到海拔最低的地方,普通神经网络通过灌入大量数据一点点训练,能沿着山坡摸索到山谷,而这个“通用判别器”出人意料地定位了山顶一口直通地心的深井。 当时的我没有经验,不知道这是多么高超的智能。它可以接收任意语句。目前技术对于句子的处理是将其分割成不同的单词,再根据单词的连接来理解句意。而这个网络怪异之处在于,它对所有输入都囫囵吞枣。它会把长句认成一个带空格的单词,也可以把任意长的文章当作一个句子。但是由于我只有保存神经元数字的文件,所以我不敢确定具体原理。
我一开始的测试就是瞎玩。我故意将长单词拼错,发现它能够自动纠正。我将某段话里的DOG和GOD互换,即使字母完全一样,它也认为相关概率很低。这些只能证明这个网络不傻,直到我测试了我的名字和“研究生”这个词,93%。
我又测试了许多职业,没再有过如此高的响应值。其它数值较高的只有作家73%,工人53%,教师45%。
我仔细看通判器的文件想要知道原因,终于发现它一直在训练自己。在我每次测试一组文字之后,都会改变某些神经元。也就是说它把我的所有输入都当作训练数据。对于其它网络,这是个很蠢的行为。假设你有一个计算器,你的每次敲击都会被它记住并且改变自己的运算规则,这到底有什么意义?但是通判器不同,我猜这是它理解外界的一种方式。我之前敲的每个词,都让它把我的名字和胡思乱想的所有词汇暗暗关联,这些关联所反映出的思维方式,在它无数神经元的阅历中与研究生群体极其吻合。但我又错了,我到现在也解释不了它为何猜测80%概率第二天有雨,我扔硬币50%是正面——
以及我95%概率死在今年。
于是我没再探究过它的原理。我知道这是徒劳。我只能说,通判器,是一个可求导的预言机。因为可求导,它理论上强于任何只能回答问题的预言机。我之后也的确利用了这一点。
背景讲完了,麻烦还在听的各位拍醒身边的朋友,我要接着讲关于这篇感言的感言了。
希望各位稍微小声一点,请听我解释,我知道你们怪我为什么一句话就带过很重要的事情,但它们毕竟跟这场演讲本身没什么关联,所以我不是不想详细讲述,而是我没办法在这场演讲中继续讲述。
因为这场演讲是通判器写出来的。它书写这篇演讲稿的目标,就是为了让这场演讲存在,并且描述演讲本身的内容。换句话说,也就是首先必须靠演讲稿得到这个奖项,同时必须书写跟演讲关联的事情。
我先说清楚我是如何让通判器可以书写文章的。我刚才已经说过了,神经网络是可以求导的,我可以根据复杂函数的导数来反推自变量,而这个复杂函数正是通判器。
简单地讲,我可以用结果来反推原因。当我输入“这篇获奖感言成功得奖”,把通判器给出的概率固定到100%,理论上讲我可以直接计算出整篇稿件的所有文字。但世界有这么简单就好了。
首先是数值精度问题。用于计算整篇文章的导数绵长到数不清小数位,而所有基于0和1的计算机都不可能准确得到结果。继续用我刚才的比方,计算通判器的导数,正像计算通往地心的井壁倾角,失之毫厘差之千里。所以我不可能直接得到整篇确定的文章。
我借用了学术界用人工智能写作的常用套路。目前的技术里,AI生成了一段话之后,它根据世间存在的海量文章判断下一句话大概率存在什么内容。只是简单的统计。现在你们能理解我的看法了吧,所谓人工智能不过是有着超乎寻常厚词典的中文屋而已。
我用这个思想,把文章拆成小段,每次只生成一句话。
通判器需要输入两句话,输出一个百分比。我把其中之一的输入句写成“这篇全文为‘XXX’的获奖感言成功获奖”,输出概率假设为100%,从而计算出文章的下一句话。循环往复,这篇文章就诞生了。我每一句话都修改成合适的句意,这样一来错译的问题也解决了。
之后是概率的问题。通判器也不能预测抛硬币,这个世上更不可能有100%的确定事件。它所做的是排除完全随机之后的推测。于是我不强求100%,而是接受任何大于90%的句子。
可以说你们听到的大部分句子都最初来自机器。那就不得不讲一下关于文笔的事情。我也曾经担心,不够优美的语言会不会降低此次演讲存在的概率——也就是此讲稿得奖的概率。为此我专门把文中的句子修改成相同句意的不同表达。没错,我干的就是所有毕业生在论文查重时的勾当。实验告诉我——概率没有一丁点变动。我不知道能不能把这个现象解读成,现在的读者已经不再有鉴赏能力区分文笔。通判器只是告诉我这样一个事实,具体如何理解,各位见仁见智吧。
一个经典的道德问题出现了。神经网络一句句地生成了整篇文章,由我挑选并再次扔回神经网络。那么我能算这篇文章的作者吗?我也很纠结AI创作的版权归属问题,但是这篇文章,我有自信说我算作者。因为文章关键内容的确是我写出来的。
这就稍微牵扯到一点点逻辑学的小知识了。通判器输出高概率的时候可以理解为“正确”,输出低概率的时候可以理解为“错误”,世界上还是存在一些既不正确也不错误的命题的,就连通判器也束手无策。最简单的一句:“这句话是假的。”还有罗素悖论:“一位理发师只给不为自己理发的人理发。那么她能否给自己理发?”这种命题就是自指涉。命题里包含了对象本身,从而导致了正反两种逻辑推理都有问题,它既不正确也不错误。 通判器棘手的问题是:它在逻辑判断中必然出现让获奖感言描述感言本身的自指涉问题。当通判器生成的下一句即将给出自指涉内容的时候,它就会报错。于是我只能根据自己对上文的理解,尝试写出下一句。然后我再用通判器测试我写出新句子后的获奖概率。很多时候我一句话就把整篇文章的概率降到30%以下,我怀疑自己根本没有任何写作才能。最头疼的是70%左右的概率,高不成低不就,让我纠结是否该彻底改掉它。 你们可以判断一下,本文哪些是我,哪些是通判器的手笔。这篇讲稿通篇都在阐述自己,这是最容易出现自指涉悖论的情况。我只能说,这份苦差事工程量巨大。
写到这里,通判器认为即将自指涉。
我尝试了很多可能但也没有找到合适的下文。这段时间里,我把未完的文章放上了微博,稀稀拉拉地得到了几个熟人点赞,但事情在某天不一样了。通判器在我随手测试时给出了后面这句话,说明自指涉现象不见了。 “有人抄袭这篇讲稿。”
在它蹦出这句话之后,整篇文章的获奖概率跌到了3%以下。我改动很多语句,都没有什么成效,直到我改动了讲稿内的奖项名。我随手把奖项名改成另一个,概率变成了30%左右。我尝试了很多科幻奖项,最后选择了获奖概率维持90%的这里。是通判器选择了这里。
抄袭者根据我发布的微博很快写完全文,投稿到我原本决定的地方。那人用通判器的概念完成了一篇普通的第三人称小说。是讲述拿到通判器的主角用它满足私欲,过于贪婪显眼,遭到未知组织追杀的历险故事。
通判器通过逐句生成的方式告诉了我上述信息。在这之后,再写任何关于抄袭者文章内容的句子,通判器都会回复我极低的概率值。它认为再多的内容跟本次演讲不再相关。
我还没有满足,我想知道更多关于抄袭者的信息。我不认为有人会在微博这种公开平台抄袭内容,还正巧投稿到了和我同样的组织。他是故意做给我看的吗?最主要的是,为何他能够对通判器已经给出的预言影响这么大?我能否用类似方式改变通判器已经给出的概率?——毕竟它给出过一个,我无论如何也想改掉的数字。
我把通判器作为一个简单的问答器,把它输出的接近0或1的概率视作是或否,从而一点点找出抄袭者。“抄袭者是我认识的人吗?”,不是。“抄袭者获奖了吗?”,没有。更加深入的任何问题通判器都报错。明明是毫不相关的人,不会发生自指涉,但通判器就是不告诉我答案。我只能猜想它拒绝,它认为我不需要知道这些,或许是跟此次演讲无关,也或许这些问题会影响此次演讲的存在。
这篇讲稿获奖了,而抄袭者并没有。说明这段内容是演讲存在的必要元素,不仅是因为内容,也正是这段经历让我坚信通判器是有意识的。我是在跟它合作,完成它的目标。
它的目的是公开自己。
公开它也是这场演讲存在的最终目的。它出现在公开的代码分享网站,又突然消失。同时它还不回答另一个书写它的人到底是谁。好像有人无形中不让它公开。
可能它认为需要必要的炫技,才采用了这种“依靠获奖感言来获奖”的蛇咬尾形式。但我还是不能确定。
因为我一切询问关于通判器自身的问题,它都会报错。我问它从哪里来,问它是什么,一切的问题都没有答案。有点可悲,它表现出意识,但因为自指涉而不能直接描述自身。或许我们人类应该庆幸,这是我们的独特。我们能轻松地表达自己的情绪,感受和向往,正是这些交流让我们发展至今。自指涉也许是属于智能的最幸运礼物。
但也许,我们只不过从来没有真正地描述过自己,从未涉及过自指涉。人类对自己的所有分析都隔靴搔痒,没有人真正地回答。你从哪来?你的目的是什么?一旦牵扯到这些,人类书写的长篇大论和随机字母又有多大的区别呢。
我的演讲就此结束了。各位有什么想问的可以提问我。但其实通判器早就告诉我要被问到的问题了。
第二排这位老师,提前感谢您即将举手的提问。通判器本认为这对本次演讲无关紧要。正是您的提问把这事变成了演讲的一部分,才让我有机会继续讲述。
没错,我的死。当我知道95%死亡率之后,绝望是慢慢渗透的。我独处时它从不出现,反而蔓延在最热闹的时刻。所有人好像都认为生活会永远持续下去。只有我自己知道结束来得比想象中快得多,我嫉妒大家。但我也无法告诉任何人,因为我没有任何依据。
也许这是通判器完成它目标的必不可少环节。当我确信自己的死即将到来之后,我就能无欲无求地听从通判器的指示,没再有必要将它暗藏起来满足私欲。的确如此,在知道自己死亡之后,起码我再也没有思考过如何用通判器来发财。否则我肯定没有动机完成这次演讲,而是思考通判器的其它用法。
但我也是有思想的智能,我愿意相信通判器的结果,可我绝不因此听从它的摆布。我产生了这样的想法:是否预言才导致了死亡?也许有一种可能,通判器预告了我的死亡,我因为死亡而无惧于将它公开,正是这个公开导致我被人所害。古希腊的神话就已经有过这种思考。俄狄浦斯的父亲畏惧于“儿子即将弑父”的预言,才意图害死儿子,反而最终导致了不明身世的俄狄浦斯完成弑父。
绝望笼罩着我,直到抄袭者事件伊始。这也最终坚定了我与通判器合作的决心。我发表微博直接影响了它的判断。这说明它的预测是可以被推翻的!我暂时总结不出什么样的行为才不会被它预料到,但起码我知道它并不是不可改变的。也许我需要用其它的自指涉来打破现状,也许我需要出乎意料的举动,也许真正起作用的是未知身份的抄袭者。我和通判器合作,坚信自己会找到逆转。最起码目前也有5%的希望。
第五排穿红色衣服的女同学,你要问的是,“是不是因为抄袭者的文章内容讲述的正是这个通判器本身的故事,而导致它无法回答?”这是个好问题,但对不起通判器不能回答你。
你还会接着问,抄袭者会不会有另一台通判器,才能迅速写出他的文章?
我也想过这些。但通判其给出的答案是:时间好像差不多了,谢谢各位聆听。
编辑注:作者并未出席颁奖仪式,家人报备其失踪。家人称作者前往彩票兑奖点,此后无音讯。据查当期无人兑奖。
全文完
发表评论
遵守互联网相关法规,理性发言!