金融倚AI大模型回首,百融云却把“蒸馏”嗅?
“为梦想窒息”式减持为AI降了半旗,用投资者的钱将股权变债券,互联网基因的发家之路只能让韭菜直呼“基操勿6”。在市场转了一圈,没有竞争对手的AI也不会风平浪静,因为一个整体瓦解的原因,通常都是埋伏在内部的老六;相似的场景,同时发生在端午安康期间的北邻。
所有盘面的图像信息,细想都是滞后性的:当减持公告发布之前,你不会知道大模型龙三尾盘上拉是何企图;当AIGC官宣定增之前,早盘的突然上冲根本不需要放量;当央媒带领数据要素走出双头,你才知道KDJ指标不用回到底部也能上涨。我们往往都说,投资人赚的是认知的钱,但就像信息不对称的你,爬到山顶之后才恍然大悟,无论走哪个方向,都已经是下坡路。
股票,是反人性的零和博弈,如果把上述条件反过来想,没利空却被带崩、有还未被钻研透的AI产品、机构用T+0保持总仓位不变的AI股,又意味着什么?其实,你不比基金经理差多少;因为,我们都曾走出过那个命中注定的考场。一批AI休整了,主线里其他公司就有资金了;一个大模型倒下了,但不代表所有大模型都被证伪了,这才是做投资的意义。所以我们继续扩展认知,依然以@百融云-W(6608.HK)为例,看看大模型里还有哪些没被人嗅到的气味。
(资料图片仅供参考)
之前有一个《挑干的唠》系列文章,已经把百融云金融AI大模型自研基底、垂直数据优势、商业模式进行过分析,但业内也出现了一个探讨,由于GPT等语言模型在巨量参数的加持下,”涌现”出了In-Context Learning的能力,加上了Finetune技巧,使得AI大模型表现出惊人的泛化能力,所以就让大模型在没有做针对性训练的情况下,在多种不同的任务上都表现不错,所以业内在议论:特定领域小模型还有没有存在的必要?就比如金融AI大模型。
我觉得这个问题可以用一篇科学文献里的图做解释,翻译成普通话,图的纵轴指模型在任务集上的准确率,横轴代表模型的参数量,作为对比基准,其中一条绿色的线是5400亿参数版本T5模型,蓝色的线是经过精调后的垂直领域模型,结论就是蓝色线参数量达到7.7亿的时候,其表现就超过了参数量是其700倍的T5模型。所以也就证明了垂直领域AI模型的重要性,但问题就在于,如何用金融AI大模型去精准地解决金融业客户的碎片化需求。
现在一些大模型厂商的方式是模型压缩,也就是将非特定任务领域的参数删除,从而达到小模型的效果,但这就会导致权重矩阵不规则,算法难以优化。另一种思路是从大模型的精度入手,比如将此前用4个字节表示的模型参数压缩成2个,但技术尚未成熟。所以最优解,就是大模型的“蒸馏”技术,翻译成普通话,就是用大模型标注出来的高质量数据训练出小模型,类似一个小学生从教材上来学习老师的知识。首先用少量的高质量人工标注数据对大模型训练,接着让模型对一批未标注数据打“伪标签”,选择那些概率大于某个阀值的伪标签数据,合并第一步的高质量数据,形成一个新的训练数据集,专攻特定领域的客户需求。
那我们落实到金融AI大模型对细分需求的解决,都知道百融云的主营业务是为银行业做智能分析与运营的,帮助银行补足用户画像来提升贷款量,所以百融云的AI大模型就要包含整个贷前、贷中、贷后流程的训练信息,才能帮银行定制完整的线上自动化审批流程。但作为贷款申请者,由于国有大行及股份制银行在各省市的市场占比各不相同,所以也会有很大一部分用户选择去股份制银行申请贷款,而如果股份制银行的用户行为信息不足,无法评定用户的风险画像等级怎么办?这个问题也就是股份制银行,更需要的是单一的贷前环节。这个时候就需要百融云在贷前环节,根据用户的过往贷款申请频次、异常交易记录、账户往来进行指标计算,同时根据每家银行不同的客户指标要求输出模型结果,而且根据黑名单等信息记录,打造银行用户的反欺诈模型和信用评分,这就是之前《挑干的唠》系列文章中提到,KS值能达到0.5的原因。
那除了贷款申请环节,如果有银行业客户只需要存款账户申请人信息评定,又怎么办?这就需要百融云AI大模型当中针对存款用户画像的信息来进行评定,比如存款账户开户者,他之前手机卡的在网状态和手机号画像是最直观的写照,如果他此前用过非实名电话卡,那百融云就直接标注为存款账户中高风险客户,这个规则也会从百融云AI大模型中直接提取出来针对特定场景;此外,电诈欺诈源、高维用户信息,都是确定0-10的风险等级。
再如银行客户在财富管理领域的需求,由于AI大模型都是黑盒模式,由大模型制定出的泛化营销策略,很难让一线执行的客户经理完全信服。但如果能用蒸馏出的特定领域AI模型策略,与银行营销的现实情况偏差度变小,那金融AI大模型便会成为客户经理的伙伴。
2023年一季报显示,百融云一季度实现营收5.66亿元,同比增幅25%;基于自研AI平台的第一大业务“智能分析与运营”收入同比增幅41%至2.81亿元;百融云自身的AI产品线“智能运营服务”,收入较去年同期增长68%;22年年报显示公司现金及等价物共计近40亿元。已有的AI业务线、积攒的金融业垂直信息,都是能从大模型到蒸馏的底气。
回到盘面我们思考一下,政策等不来、赛道涨不动、周期没见地,那除了把AI修复一下,还能有第二个选项吗?