如何分辨机器人给你写的信

本文是翻译,版权归原作者所有


下一代图灵测试?手写体

一周前我被机器人欺骗了,在邮件里。

我正在过滤我的邮箱,从回收箱里翻着垃圾。几乎到达我邮箱里的每封信都是垃圾邮件,因此我翻呀、翻呀、翻呀……突然,哎哟:一封手写体的信。看起来不像是垃圾邮件,我拆开了——却发现它是一份含油的、让我二次抵押房子的邀请函。我被愚弄了。

通常,我能够在10步开外分清伪造的、“手写”打印字体的营销公函。这种材料比Comic Sans字体【注1】勉强多些人类特征,由镭射碳粉打印而非钢笔的墨水。

(译者注:这里是youtube视频的地址:http://www.youtube.com/watch?v=uyXlChb7-HI

但是,这表明了营销人员正致力于努力开发各种形式的批量生成的邮件,它们看起来有着真人手写体的耐心和可爱。他们使用着在纸上挥舞着钢笔的手写机器人。这些机器成本有五位数,但是生成出了非常像“人”的信件。(你可以看到上面视频里其中一个机器人的动作)这种机器人更像是愚弄我的、在垃圾邮件信封上用钢笔写地址的那种机器人。我看到纸上的墨水,潜意识地凭直觉认为它来自于真人(因为,不是激光打印!)然后才打开的。

手写体,貌似,正成为下一代图灵测试。

这不应该让人觉得惊奇。在过去的十年,让人们打开垃圾邮件和在线恶意软件的需求催生了某些最具创新和十分滑稽的、让机器人看起来像真人的企图。(我喜爱的是21世纪00年代中期那一波垃圾邮件机器人,引用经典文学,企图绕过被设计为识别阴茎增大调用的、贝叶斯过滤。)

如今机器人正在尽量像我们一样书写。但是它们还不够完美!有一些令人感兴趣的、人类心理和字母队形是机器无法模拟的。掌握这些技巧,你就可以区分机器人了。

Brian Curliss and Daniel Jurek

我首次听到这些人类与机器人手写体的不同是在上周的一个大会上,当时和创业公司Maillift联合创始人Brian Gurliss和Daniel Jurek一起。如果你需要给潜在销售客户发送200封个性化邮件、但是没有时间亲自手写——或者如果你的笔迹和我一样差劲——那么Maillift将为你生成,使用真实的碳基人们的团队。(哪种人喜欢为其他人写手书信?“教师”,Gurliss回答道。很明显教师有优美的书写体,对这门手艺有着更多的荣誉感,想在晚上和周末赚些外快。)

Gurliss和Jurek也有一个手写体机器人,因此他们已经研究了成千上万封手写体信件,并与机器生成的信件做比对。他们已经识别出三个至关重要的区别。它们是:

清晰的中心

1_iJG5-u2C3_Z3buuOu6M9JQ

真实人类写的——确切地说,Gurliss在我的笔记本上使用了Pilot G2钢笔。

仔细看这些笔触。当人们用手写的时候,我们使用不规则的力,经常在向下划的时候在钢笔上用的力更大。这就产生了一个“清晰的中心”:如果你考察墨水线条的每一个笔触,线条中央——线条的中部——多少有些透明且没有墨水。钢笔把墨水弄在了线条的左右两侧。在这个例子中,清晰的中央在“Maillift”中的“t”上面尤其明显。

机器人不会这样做。“机器人写的字母,非常具有连续性,甚至更有连续性,”Jurek说。“钢笔向下或者向上,不过它从来不会真正处于两者中间。”下面是机器人手写体的例子:

1_t-GU0MMJkw00t7zJ6R_DvQ

看到了吗?没有清晰的中间部分。

生产机器人的公司当前忙于匹配这种人类的不规则性,但对于现在,你得到的机器人邮件只是一个样品。

(顺便说一下,我对文章插图的糟糕质量表示抱歉。当我遇到Gurliss和Jurek时,我的手机是Nexus 4,它的相机非常让人难受。)

下一个不同是什么?

在“i”上面的点

1_w-5FGwPznxZRJRrhfOqOJw

如果你怀疑机器人给你发送了一封情书,请检查字母“i”的小点的位置。如Jurek说的,如果这个字母上面是由机器人写的,“这个‘i’总是以同样的方式打点。”它们太有规律了。每一次这个点都精确地出现在“i”上的同样位置。

人类从来达不到这种精确度。疲惫的情绪、手的位置移动都会影响点的位置。“人们写‘i’上的点和在句子的末尾加标点符号,取决于他们在书写过程中的感受,”Jurek补充道。

再一次,我们可以期望机器人在模仿人类的所有不规则性上能够做得更好。最好的书写机器人已经在一些字母上呈现出不同,以避免太过单一。看看上图第三行的“offer”:两个“f”就不一样。机器人被程序控制用一些不同的方式书写那个字母,这样就能更好地欺骗读者。

但是在人类和机器人书写艺术上的最终不同也是最微妙的,对我而言也是最令人着迷的。它就是:

弧形的右边缘

当人类手写时,我们的边缘是——你猜到了——不规则的。在段落的左侧,我们尽量保持好看的直线边缘,即每一行都在同样的位置开始。但是我们通常不能精确地保持下去。我们向里移动,朝着页面中心产生了一个缓慢倾斜的左侧边缘。下面是Maillift发送给客户的一封手书体信件的例子:

1__KjujfGCMZi7ffi3-ME7wA

看到左侧向里漂移了吗?这些线开始于“choose”,“color”、“logo”都向右移动了。

但是右侧边缘的样子更加夸张。

Gurliss和Jurek已经注意到,他们的人类手写体经常产生一个“弧形”的右侧边缘:它向外膨胀,然后向里折回。在上面的例子,“showcase”比上面一行的“option”更加突出。但是,随后这些行开始向里缩回,“size”和“own”一步一步地向页面中间移动。

人类为什么要这样子呢?很可能是因为我们极度不擅长每行能写多少单词。如果我们不小心写满了一行——试图在一行里堆了太多单词——我们马上会过度补偿,从而变得非常小心,在接下来的几行里只放入少量的单词。你能够看到上面例子中的动态情况。作者写了得体的第一行,但是下一行塞了太多单词,比如“showcase”不幸过于接近页面的边缘了。因此他或她马上折回,接下来的三行在长度上都收缩了。

相比而言,机器人精确地知道每个单词要占用多少空格,不会犯这种错误。你看不到右侧的弧形边缘。

当然,机器人也是通过编程模仿这种情况的。

有一半时间,我对于有如此多的人致力于让机器愚弄人类感到愤怒、惊恐和厌烦。

但是另一半时间,我感到有点儿崩溃,艾伦·图灵【注2】的狡诈的、有冒险精神的1950年的想法实验的实践者一直都不是哲学家、计算机科学家或高级人工智能实验室,而是……营销人员。在理解人类意识的不规则轮廓的难度上,前人们已经垮掉了数年。而营销人员只是让你打开他们的该死的邮件。理解人类思想和行为的秘密是困难的。努力赶上?还不够!这就是图灵测试让人感到不安的一部分原因:人类,真的是我们容易拷贝的吗?

你要注意了,现代生活的这种特定的刀锋战士维度很快就会相应地消失,因为很明显,邮件本身正在快速消退。定期写信的诚实的、真正的人的数量近几年一直在稳步萎缩。因此在手写到达它的存在极限之前,或许不会太长时间了。一个手写体的信封将不会成为人性化的试金石,而是我们收到的来自于冰冷数据库的、一种套用信函的确切证据。我们将用与今天相反的逻辑来筛选所有的信件,所有用钢笔写的(机器人、机器人、上帝啊,又一封机器人写的)信件将立即被扔到一边,但是突然停住了,因为一封点阵打印的信封的出现让你感到吃惊了。

嗯,我们将对自己说:现在,这可能是真的。

译文:如何分辨机器人给你写的信 》| 腊八粥