第94章显而易见的局限

肖宿对这些喧嚣一无所知。

他正在实验室里，调试“小智”系统的新版本。

周瑾、苏芮、刘浩然、林砚四个人围在他身边，大气不敢出。

“肖哥，明天的PPT……”周瑾小声提醒。

“准备好了。”肖宿头也不抬，“昨晚改完了。”

“那……你要不要提前演练一遍？我们可以当听众。”

“不用。”

肖宿敲下最后一行代码，按下运行键，“讲一遍就行了，浪费时间。”

屏幕上的程序开始执行，数据流飞快滚动。

肖宿看着那些跳动的数字和图形，眼神专注。

他其实并不紧张。

数学是清晰的，逻辑是严密的，该讲的讲清楚就行了。

至于台下坐的是院士还是学生，对他来说没什么区别。

如果真要说有什么期待……那就是希望提问环节，能有人问出真正有价值的问题。

……

报告会当天下午一点，京大百年讲堂外已经排起了长队。

不是夸张，是真真正正的长队，从讲堂正门口沿着林荫道蜿蜒出去上百米，全是拿着学生证或邀请函等待入场的人。

有京大本校的学生，有从华清、沪交、金陵大学赶来的外校师生，甚至还有几位白发苍苍的老教授，在助手的搀扶下站在队伍中。

“我的天，这阵仗……”

一个京大数院的大二学生踮着脚往前看，“比明星演唱会还夸张。”

他旁边的室友拿着手机狂拍：

“废话，这可是肖神！十五岁登上《数学年刊》的男人！你看前面那几个，是不是华清的姚院士？我在新闻上见过他照片！”

队伍前方，姚毅智院士确实站在那里。

他穿着朴素的夹克衫，戴着老花镜，正和身边的几个博士生低声讨论着什么，完全没在意周围投来的目光。

倒是他身后的几个年轻人有些紧张，毕竟是第一次在这么多同龄人注视下排队。

钱卫华院士来得稍晚一些，带着国家算力研究院的两个研究员，直接从工作人员通道进去了。

总不能真让院士在外面排队。

一点二十分，讲堂大门打开，检票开始。

人流缓缓涌入。

八百个座位，不到十分钟就坐满了八成。

前排最好的位置留给了受邀嘉宾和学校领导，姚院士坐在第三排正中央，钱院士在第四排。

两人隔着几排座位点头致意，算是打过招呼。

学生们抢座的速度堪比超市大减价。

有人为了占座连午饭都没吃，进来后赶紧从包里掏出了面包和矿泉水。

有人带了笔记本、录音笔、甚至还有带小型摄像机的。

虽然按规定不能录像，但总有人想碰碰运气。

讲堂里嗡嗡的交谈声像蜂群。

话题只有一个：肖宿。

“你说肖神等会儿会紧张吗？台下这么多大佬。”

“紧张？你看佐藤事件他紧张了吗？直接围脖甩清单打脸，那叫一个干脆利落。”

“也是……不过这次不一样啊，现场提问，万一答不上来怎么办？”

“答不上来？兄弟你是没看肖神的论文吧？他那套理论，我敢说台下能完全听懂的不超过五十人。还提问呢，能问出像样问题就不错了。”

“卧槽，这么夸张？那我岂不是来当气氛组的？”

“自信点，把‘岂不是’去掉。咱们就是来见证历史的，听懂多少算多少。”

一点五十分，陈景明、顾清尘、江明远跟着一众京大领导入场，在前排嘉宾席就座。

江明远满脸红光，看着座无虚席的讲堂，心里已经在盘算今年的招生宣传片该怎么剪了。

一点五十五分，讲堂里的灯光暗了下来，只留下讲台上的照明。

嘈杂声渐渐平息，所有人都屏住呼吸，看向舞台侧方的入口。

一点五十八分，肖宿出现了。

他还是那身打扮，浅灰色T恤，深色牛仔裤，黑色双肩包。

走上讲台的步伐平稳，放下背包，插好U盘，打开PPT，调试麦克风。

整个过程行云流水，花了不到一分钟。

两点整。

肖宿抬起头，看向台下。

八百多双眼睛聚焦在他身上，那种被注视的压力足以让任何人紧张。

但他的语气依旧平稳。

“我是肖宿，今天讲群论在自监督特征解耦中的应用，以及周氏猜想证明中的方法技巧。”

没有开场白，没有感谢致辞，除了名字外没有多余的自我介绍，直接进入正题。

台下静了一瞬，然后响起低低的笑声和议论。

“这也太直接了吧……”

“肖神风格，符合人设。”

“我喜欢，不浪费时间。”

讲台上，肖宿已经点开了PPT第一页。

标题很简单：“群作用下的特征空间统一表示”。

“传统多模态学习的问题在于，不同数据类型的特征空间是异构的。”

肖宿的声音通过麦克风传遍讲堂，清晰而平静。

“图像用卷积神经网络提取特征，文本用Transformer，语音用梅尔频谱。这些特征向量维度不同，结构不同，度量不同。强行融合就像把苹果和橘子加在一起算总数，没有意义。”

他在白板上画了两个不相交的圆圈，分别标注“图像特征空间”和“文本特征空间”。

“我的思路是，引入群论作为统一框架。”

肖宿切换PPT，出现了一个复杂的数学结构图。

“所有数据模态，经过编码器映射到同一个群表示空间。在这个空间里，图像旋转、文本语法变换、语音时移，都可以看作群作用。”

台下，姚毅智院士眼睛一亮，迅速在笔记本上记下几个关键词。

“关键在于对称性约束。”

“每个数据模态都有其内在对称性。”

“图像有旋转、平移、缩放对称；文本有语法、语义对称。”

“自监督学习的目标，是在保持这些对称性的前提下，解耦出独立的特征因子。”

他调出了一段代码演示。

屏幕上，一个简单的神经网络正在训练，输入是未标注的图像和文本对，输出是解耦后的特征向量。

“训练过程中，系统会自动发现不同模态特征之间的对应关系。”

肖宿指着屏幕上的损失函数曲线。

“这是群等变约束损失，这是特征解耦损失。两者结合，就能实现跨模态的自然对齐。”

钱卫华院士身体前倾，盯着屏幕上的公式。

他是搞超算出身的，对算法效率极其敏感。

而肖宿展示的这个框架，计算复杂度明显低于传统的多模态融合方法。

“具体到实现细节……”

肖宿开始深入技术核心。

接下来的三十分钟，他像拆解精密的机械一样，将整个群论框架一层层剥开。

从李群在流形上的作用，到特征空间的纤维丛结构，再到自监督信号的构造方法……

讲堂里的气氛开始变得有些微妙。

前十几分钟，大部分学生还能勉强跟上，毕竟肖宿讲得深入浅出，而且还用了很多直观的比喻。

二十分钟后，大多数学生已经开始眼神涣散了。

那些“李代数”、“表示论”、“上同调”之类的术语，像天书一样在头顶飞舞。

“我……我听不懂了。”

一个数院大三的学生痛苦地捂住脸，“虽然我们已经在上抽象代数了，但肖神讲的东西，好像跟教科书上的不是一个次元啊……”

他旁边的室友更惨，已经选择放弃治疗，开始在笔记本上画小人了。

“没事，听不懂正常。我怀疑咱们系一半的教授现在也在硬撑。”

确实，中后排的教授们表情各异。

有的频频点头，显然跟上了思路；有的眉头紧皱，努力消化那些新颖的概念；还有的已经在翻看提前打印的论文，试图对照理解了。

姚毅智院士的笔记本已经写了三页。

他偶尔会停下来思考几秒，然后快速写下新的想法。

身后的博士生们就没这么轻松了，一个个如临大敌，拼命想跟上节奏。

“现在看一个具体应用。”

肖宿切换到了“小智”系统的演示界面。

屏幕上出现了那个简洁的对话窗口。

肖宿先输入了一个很简单的水果分类问题，小智在几秒钟的时间里就能够自动完成思考并作出回答。

这看似简单的一幕，却让懂行的人脊背发麻。

聪明的网友可能要问了，这么简单的问答，现在的DeepMind、OpenAI等顶尖机构的AI模型都能轻易做到，有什么特别的呢？

答案就在于小智回答肖宿问题的答案，事先并没有在训练数据中明确标注，而是系统通过特征解耦自主“理解”的。

类似OpenAI这样的顶尖模型，其实本质上走的是“记忆匹配+概率推测”的路子，它们之所以能给出正确答案，不过是记住了“吃=减少”“收到=增加”的固定关联，熟记了苹果对应红色、橘子对应橙色、梨对应黄/绿的统计规律，靠着海量训练数据中的样本匹配，找到最贴合问题的回复，如同背会了答题模板，却从未真正理解问题的本质。

它的数据内容多了，回答的答案正确的概率也上升。

但是，又因为它的数据库杂乱的内容太多，导致最后连开发者都无法知道它会给出什么答案，也就是“黑箱”。

这也是有些人工智能会被聪明的网友称作人工智障的原因。

它们的局限是显而易见的。

无法真正拆解问题中的核心特征，更无法建立特征间的独立关联，一旦遇到超出训练样本的场景，比如颜色特殊的水果、复杂的数量组合，就会出现卡顿、判断偏差，甚至混淆不同特征的边界。

但肖宿运用群论实现的自监督解耦框架，彻底打破了这种局限。

　　(https://www.lewenn.com/lw58069/52147688.html)

1秒记住乐文小说网：www.lewenn.com。手机版阅读网址：m.lewenn.com

第94章 显而易见的局限

第94章显而易见的局限