乐文小说网 > 凤求凰之AI赘婿 > 第六章 周教授的标准

第六章 周教授的标准


陆辞渊忽然理解了周教授的想法——他不是在构建一个客观的诗歌评价体系,他是在教Ling-1“他的”审美。就像一位老师教学生欣赏诗歌,不是通过公式和规则,而是通过分享自己的感受:“你看,这首诗的这个地方,我觉得特别好。你体会一下。”
他把咖啡杯里最后一口又甜又腻的液体喝掉,开始处理语料库。
第一件事是把所有数据导入到Ling-1的训练管道中。这个过程需要写大量的预处理脚本——清洗文本、统一编码、构建索引、划分训练集和验证集。陆辞渊的手指在键盘上飞舞,代码像流水一样从指尖倾泻而出。
他进入了一种心流状态。在这种状态下,时间变得模糊,外界的声音消失,整个世界缩小到屏幕上的字符和他脑海中的逻辑结构。这是他最擅长的事情,也是最让他感到安全的事情——代码是确定的,如果你写对了,它就会做你期望的事。没有歧义,没有误解,没有需要猜测的潜台词。
不像人。
不像周教授那些意味深长的话,不像父母在电话里欲言又止的沉默,不像那个金色U盘里四十七分钟的录音——里面每一句话都需要他去揣摩背后的含义。
代码是简单的。人不是。
三个小时后,预处理完成了。陆辞渊检查了一下数据统计:总共2,187,432首诗,来自3,246位女诗人。时间跨度从公元前2世纪到公元1911年。情感标注覆盖了其中约30万首,心动值标注覆盖了约1万首——那显然是周教授亲手标注的,是他的“精选集”。
陆辞渊看着那个心动值分布,发现最高分10分的诗只有十七首。
他好奇地点开来看了一下。
第一首就是卓文君的《白头吟》。周教授在旁边用红色标注了一行小字:“每一次读,都会哭。二十年了,没有例外。”
第二首是蔡文姬的《悲愤诗》选段。标注是:“不是技巧的问题。是生命的重量。”
第三首是李清照的《声声慢·寻寻觅觅》。标注只有两个字:“绝唱。”
第四首不是汉代的,也不是宋代的,而是一首明代的诗,作者叫冯小青,一个他从未听说过的名字。诗很短:
“冷雨幽窗不可听,挑灯闲看牡丹亭。人间亦有痴于我,不独伤心是小青。”
周教授在旁边写了一整段话:“冯小青,明代女诗人,十六岁嫁为人妾,十八岁郁郁而终。临终前请画师为自己画像,画了三幅都不满意,最后一幅画成之后,她焚香设酒,对着画像哭泣而死。这首诗是她读《牡丹亭》时写的——‘人间亦有痴于我’,她在杜丽娘身上看到了自己的影子。三百年后,我在她身上看到了某种东西。某种无法用语言描述的东西。”
陆辞渊盯着屏幕,沉默了很久。
他忽然意识到,周教授给他的不只是数据,而是一种观看世界的方式。这些标注、这些心动值、这些密密麻麻的笔记,是一个老人用二十年的时间,一点一点地把自己灵魂的形状刻画出来。
而现在,这些数据要被喂给一个AI。
他忽然有些犹豫。这样做对吗?把一个人的审美、情感、甚至泪水,转化成训练数据,变成模型权重矩阵中的一个个浮点数?这是致敬,还是亵渎?
他靠在椅背上,闭上眼睛。


  (https://www.lewenn.com/lw61336/40866198.html)


1秒记住乐文小说网:www.lewenn.com。手机版阅读网址:m.lewenn.com