第308章 机器先筛一遍,但经常筛错
2019年4月15日,星期一,上午九点。
深圳,默石资本,技术部。
科创板申报企业的数量正在以每周十几家的速度增长。截至上周末,上交所已受理的科创板企业累计超过七十家,预计到月底将突破百家。研究部的人手不够用了——不是不够用,是根本看不过来。一份招股书两三百页,读完至少半天,写一份初步评估报告又得半天。七十家,即使全员扑上去,也要一个多月。而申报还在继续,新的企业不断涌入,像永不停歇的潮水。
陆方站在大屏幕前,手指在触摸屏上滑动。屏幕上显示的是星海平台的最新功能界面——“科创板企业批量评估模块”。这是他带着团队连续加班三周的成果。模块的核心是一个自动化的数据提取和评分引擎:上传招股书PDF,系统自动解析文本,提取关键财务数据、研发指标、专利信息、治理结构等要素,然后根据预设的评分模型生成标准化评分卡。一份两百页的招股书,从上传到输出评分,平均耗时三分钟。
“上周五晚上,我跑了六十七家企业。”陆方点开一个文件夹,里面是一张长长的表格,“从晚上十点跑到凌晨两点,四个小时,全部跑完。每家公司生成一份评分卡,包括综合得分、分项得分、关键指标对比、风险提示。”
他切换到表格视图,六十七家公司的评分从高到低排列。第一名还是那家苏州半导体设备公司,78分。第二名是一家做创新药的公司,75分。第三名是某高端装备制造企业,72分。最后几名,分数在30分上下,大多是模式创新类、商业模式尚未验证的公司。
陈默站在陆方身后,看着那张表格。周寻坐在旁边的工位上,面前是星海的详细日志输出。林枫靠在门框上,双手抱胸,表情严肃。
“效率确实高。”陈默说,“准确率呢?”
陆方和周寻对视了一眼。周寻开口:“这就是问题所在。”
他调出星海的详细日志,翻到其中一条记录。这是一家做肿瘤免疫药物的生物医药公司,名叫“康宁生物”,在星海的评分中排在中下游,综合得分只有55分。周寻指着扣分项明细:“你看这里,‘研发进度’这一项,星海扣了10分。扣分原因是——‘临床III期’被系统读成了‘尚未完成试验’。”
陈默凑近屏幕。星海的文本解析模块把招股书中“公司核心产品已进入临床III期”这句话提取出来,但在语义分析环节,错误地将“III期”归类为“仍在试验阶段,未接近商业化”。实际上,临床III期是新药上市前的最后一关,完成III期意味着距离获批上市只有一步之遥。这是一个典型的专业术语理解错误。
“还有更离谱的。”周寻翻到另一条记录,“这家做基因测序的公司,招股书里写‘公司拥有下一代测序技术平台’,星海读成了‘测序平台’,然后和一家做测序仪的公司的专利做对比,得出‘技术路线成熟度不足’的结论。但它俩根本不是一个东西。”
陈默看着那些错误记录,沉默了几秒。“这些错误,人能看出来吗?”
“能。”周寻说,“只要有一点行业知识,就不会犯这种错。”
“所以,星海的定位不是‘替代人’,是‘辅助人’。”陈默转过身,面对技术部的几个人,“它负责快——把人从重复劳动中解放出来。人负责准——纠正它的错误,做出最终判断。”
陆方苦笑。“可问题是,它错得有点多。这个版本,误判率至少25%。”
“25%的误判率,意味着75%的判断是对的。”陈默说,“如果让你一个人看一百份招股书,你能保证75%的判断都对吗?”
陆方愣了一下。“不能。看到后面,脑子都糊了。”
“所以,星海的价值不是‘不犯错’,是‘保持稳定’。它不会累,不会困,不会因为看了五十份招股书就开始走神。它的错误是系统性的、可修正的。我们只要知道它容易在哪些地方犯错,人工复核那些部分就行。”
周寻摘下眼镜,擦了擦镜片。“也就是说,人机协同,各司其职。星海做它擅长的——快;人做我们擅长的——准。”
陈默点头。“就是这个道理。”
林枫从门框边走过来,在周寻旁边的工位上坐下。“康宁生物这家公司,我让研究部的人看一眼。如果星海真的误判了,那就是一个机会——市场可能也低估了它。”
“好。你安排。”陈默说。
第二天上午,研究部的小赵花了两个小时,重新读了一遍康宁生物的招股书。他的结论与星海截然不同:这家公司的核心产品已经进入临床III期,且数据显示疗效显著优于现有疗法;公司的研发团队背景很强,首席科学家曾在美国顶级药企工作多年;虽然公司尚未盈利,但现金流充足,账上现金够烧三年。小赵给出的初步评级是A-,比星海的C+高了两个档次。
“星海扣分的主要原因是读不懂‘临床III期’的含义。”小赵在晨会上汇报,“如果人工修正这一项,它的综合评分会从55分提升到72分,进入A-档。”
陈默看着那份报告,沉默了几秒。“康宁生物,列入观察池。等下一轮申报材料出来,再仔细研究。”
沈清如补充道:“另外,我建议把星海在专业术语理解上的错误记录下来,建立一个‘术语词典’。下次遇到同样的词,就不会再错了。”
陆方点头。“好,我让团队做。”
陈默站起来,走到白板前。他拿起马克笔,在白板上画了两条线。一条是直线,代表“快”;一条是曲线,代表“准”。两条线交叉,交叉点写着“人机协同”。
“星海负责快,我们负责准。它跑第一轮,我们跑第二轮。它筛掉明显不行的,我们深挖有潜力的。它犯的错,我们记下来,教它改进。三个月后,它的误判率会降到20%;半年后,15%;一年后,10%。”
他放下笔。“这不是一个项目,是一个长期的工程。我们不是在造一个工具,是在培养一个伙伴。”
会议室安静了几秒。陆方站起来。“那我去建术语词典了。”
“去吧。”
陆方转身离开。陈默坐回椅子上,翻开康宁生物的招股书摘要。他想起2015年,星海还只是一个雏形,连财务数据都经常抓错。四年过去了,它能处理PDF,能提取关键数据,能生成评分卡。虽然还会把“临床III期”读成“尚未完成试验”,但它已经比当年强了十倍。
他在那页摘要的空白处写了一行字:AI的局限,也是人类的机遇。
然后他合上文件,走出会议室。窗外,深圳的阳光正好。四月的城市,木棉花已经谢了,但绿叶正茂。远处的平安金融中心在阳光下闪着冷光,像一根银色的指针,指向南方。
他想起老陆说过的一句话:“小陈,机器永远不会比人聪明。因为聪明,是知道什么该做、什么不该做。机器只知道怎么做。”
今天,星海知道怎么做了。但它还不知道,什么该做,什么不该做。那是人的事。
(https://www.lewenn.com/lw59180/40828107.html)
1秒记住乐文小说网:www.lewenn.com。手机版阅读网址:m.lewenn.com