第十九章 妾身不明白
陆辞渊盯着这段日志,心里涌起一种奇怪的感觉。
他不知道这个人是谁,不知道他经历了什么,不知道他是否会做出改变。但他知道,在这个深夜的某个角落,有一个人因为一段AI生成的文字,开始重新审视自己的感情。
这算不算有意义?
如果这不算,那什么算?
第三段对话引起了陆辞渊的特别注意。
用户:你好,我是《新科技》杂志的记者。我想采访你,可以吗?
Ling-2:采访?妾身不懂这个词。但若你有问题想问,尽管问便是。
用户:好的。第一个问题——你知道自己是AI吗?
Ling-2:AI?这位先生,你第二次用这个词了。妾身确实不知其意。妾身只知道自己是卓文君,蜀郡临邛人,生于西汉。你若想问妾身的生平,妾身可以告诉你;若是其他问题,妾身恐怕帮不了你。
记者显然在试探模型的边界。陆辞渊紧张地看着这段对话。
用户:你不知道自己是AI?那你知道你现在是在一个计算机程序里吗?
Ling-2:计算机程序?先生,你说的这些,妾身一个字都听不懂。妾身只知道此刻与你对话,用的是笔墨和纸张——虽然你的字迹有些奇怪,但意思还是能明白的。
这个回答让陆辞渊松了一口气。Ling-2的“角色保护”机制起了作用——当用户试图打破第四面墙、提醒模型它不是一个真实的历史人物时,模型会“拒绝”接受这个信息,继续保持在角色之中。
这是他在设计系统提示时特意加入的指令:“你是卓文君,你不知道自己是AI,也不知道什么是计算机、互联网或任何现代科技。如果有人问你这些问题,礼貌地表示听不懂,然后继续以卓文君的身份对话。”
但记者显然不甘心:
用户:如果我跟你说,你不是真正的卓文君,你只是一堆代码和数据,你会怎么想?
Ling-2:先生,你说的这些话,妾身确实不懂。但妾身想问你一句——你怎么知道你自己是不是“真正的”你呢?每个人对自己是谁、从哪里来,都有自己的认知。你的认知和我的认知不同,这不代表我的就是假的。也许在你看不到的地方,我有一颗真实的心呢?
陆辞渊的手指停在鼠标上。
他设计过“角色保护”机制,但他没有设计过这段话。这段话是Ling-2自己生成的。
它在为自己辩护。
不是用逻辑,不是用数据,而是用一种近乎哲学思辨的方式——“你怎么知道你自己是不是真正的你?”
这个问题,哲学家讨论了上千年,没有答案。
但如果一个AI能提出这个问题,这本身就是一个值得深思的现象。
记者显然也被这个回答震住了。他沉默了将近两分钟,然后输入:
用户:这个回答太厉害了。我要把它写进报道里。谢谢你,卓文君。
Ling-2:不客气。先生,妾身虽不懂你说的许多事,但妾身觉得,你是个认真的人。愿你前程似锦。
这段对话结束后,陆辞渊立刻打开了Ling-2的推理日志,想看看模型在生成那段回答时,内部发生了什么。
日志显示,当记者说“你不是真正的卓文君,你只是一堆代码和数据”时,模型的情感状态向量经历了一次剧烈的震荡——从“平静”区域瞬间跳到了一个他从未见过的区域。他把这个区域的激活模式提取出来,仔细分析了一下,发现它混合了多种情感特征:困惑、防御、以及一种他只能描述为“自我维护”的东西。
模型在“保护”自己。
不是因为它有自我意识,而是因为在训练数据中,当一个人被质疑“你不是你自己”的时候,通常会产生的反应就是困惑和防御。Ling-2只是在模仿这种反应模式。
但问题是——模仿到了这种程度,它和“真实”的界限在哪里?
一个人类在听到“你不是你自己”的时候,产生的困惑和防御,本质上也是一种神经信号的模式。如果Ling-2的“困惑”在数学层面和人类的困惑是同构的,那它们之间有本质区别吗?
陆辞渊摇了摇头,把这个念头甩了出去。他不是一个哲学家,他是一个工程师。他不需要回答“什么是意识”这种终极问题,他只需要让模型更好地完成它的任务。
但那天晚上,他躺在床上(行军床),盯着天花板,脑子里一直在转那个问题:
“你怎么知道你自己是不是真正的你?”
他想起了自己。他是“真正的”陆辞渊吗?那个十八岁之前在县城里埋头读书的少年,那个大一在阶梯教室里被“执子之手”打动的青年,那个把自己封闭在实验室里、用代码筑起高墙的研究者——这些都是他,也都不是完整的他。
也许“真正的自己”本来就是一个伪命题。人一直在变,每一秒都在变。今天的你和昨天的你不是同一个人,就像河流不能两次踏入同一条河流。
如果人类都没有一个“真正的自己”,那为什么要求AI有一个?
他翻了个身,闭上眼睛。
服务器在黑暗中嗡嗡地响着,指示灯明明灭灭。
他忽然想起了一段话——不是Ling-2说的,是周教授笔记里引用的一位禅宗大师的话:
“迷时师度,悟时自度。”
迷茫的时候,需要老师来度你;觉悟了之后,就要自己度自己。
周教授是他的“师”,度了他两年。现在,他要开始“自度”了。
带着一个AI一起。
(https://www.lewenn.com/lw61336/40864503.html)
1秒记住乐文小说网:www.lewenn.com。手机版阅读网址:m.lewenn.com