证券时报券中社讯,近日盈米基金高级技术总监吴珂皓就人工智能的相关话题接受证券时报记者的采访,吴珂皓表示,目前部分行业AIGC已开始替代人的作用,比如,在直播行业,数字人技术已经开始替代人来完成直播;在电商行业,AIGC技术可以协助制作产品宣传文案和完成相关设计。对于财富管理行业来说,由于其特殊性,完全替代不太可能,但AIGC在中后领域的应用能够有效帮助金融机构提高服务效率,比如盈米基金且慢通过用户标签体系和大模型建设,实现投教陪伴内容与用户个性化需求的高效、高度的匹配,能更好的帮助投资者在波动中不焦虑,提升投资认知和体验。
吴珂皓认为,AI大模型在财富管理行业可以设置一些必要的“考试”来评定AI模型的水平,但是AI大模型最终还是要由人来操作和管理。这种情况会跟自动驾驶类似,自动驾的应用是跟AI大模型的应用一样,面临伦理问题。比如一旦出现了交通事故,或者客户出现资产损失,这个相应的责任由谁来承担。至于认定方法,一方面可以对模型进行终端测试,设计一些标准测试集,模型上岗前必须通过标准测试集的考试;另一方面是模型训练使用的数据可以进行认定和审核,这相当于对学生上课使用的教材进行审核。
(资料图)
对金融企业而言,吴珂皓说到,除了模型本身的技术投入以外,更多的投入将会是在数据和场景上。AI投资圈里有这样一句话:场景优先、数据为王,模型本身不是用户需要的,用户需要的还是更加符合客户预期的收益和风险,光有模型没有场景,就会陷入拿着锤子找钉子的尴尬地步,所以如何将AI模型的能力渗透进入场景是一门值得大家深度投入的事情。
具体到盈米基金的实践,吴珂皓表示,盈米基金在大规模语言模型的探索和应用比较早,在用户洞察、投研投教内容生产与运营、合规管理等方面通过标签化、标准化、数据化的底层能力的打造和模型建设,不断迭代升级‘智能投顾’的服务能力。比如,盈米基金且慢在征得用户同意的情况下,尽量为每个人提供「千人千时千面」的专属服务——且慢根据投资者的年龄、财富实力、投资经验、风险偏好和收益预期等差异,把不同的理财教育内容、产品组合方案,在不同的时间,推荐给不同的客户,帮助用户提升投资认知水平和投资持有体验。
且慢在为客户设计投顾方案之前,会深入分析了基民投资亏钱的原因,其中追涨杀跌、资金错配、短期频繁交易都是导致客户投资亏损的重要原因。通过跟踪客户每一个交易的流程、每一个服务的动作,随着市场行情的变化,面对不同客户在不同的市场环境下,大数据模型可以帮助投顾提供更精准的个性化服务。
另一方面,数据将会是未来金融机构本地大模型差异化竞争所在,只有模型学习了更多、更好的数据后,大模型的真正能力才会得以发挥,这就好比相同天资的人,谁知识读得多、学习的知识更贴近使用场景,谁就能胜出。
目前的大语言模型技术来源主要有三种:一是海外的,类似OpenAI提供的ChatGPT这种;二是国内一些大厂提供的模型,比如百度的文心一言、阿里的通义千言等;三是开源的,比如llama、ChatGLM、Bloom等。
在私有化部署的时候,吴珂皓认为一般会有几个方面问题,特别是模型智能程度、部署成本、任务迁移、合规性方面。“目前,大语言模型在财富管理行业的应用落地,特别是本地私有化模型的落地还处于比较早的初期阶段,很多企业都还在观望、调研、准备。确实有很多技术上的、合规上的问题有待进一步验证和明确。”
智能程度方面,因为支持私有化部署的模型可供选择的空间不大,所以他的智能程度肯定是远远不如OpenAI的GPT4模型的,因此效果也会大打折扣。因此这类模型的私有化部署只能在有限场景下使用,远远达不到OpenAI的模型的效果。
任务迁移方面,吴珂皓认为,开源模型因为训练数据集的原因,导致在场景落地的时候,会出现一些水土不服。比如训练的任务类型跟具体的任务场景有偏差,直接使用会有效果损失。这种情况,我们需要利用企业自主数据集来进行特定任务、特定场景的针对性优化。
部署成本方面,吴珂皓说到,因为模型的智能程度、模型训练等,这些都给模型的部署带来了高昂的成本。除了个别规模小一点的模型可以在消费级的显卡上训练外,其余的模型都需要在多张A100的机器上进行训练。但是规模小的模型效果又达不到最佳效果,而A100等显卡不管是租赁还是采购,成本都非常大。
合规性方面,吴珂皓指出,本地模型在做具体场景落地的时候,势必会要用到各种数据,那么这些数据是否涉及用户隐私、是否涉及知识产权问题,这些合规方面的问题都是每个机构本地大模型落地需要面对的问题。
目前,盈米基金已经建立了比较成熟的金融数据平台,在这样一套大数据底层建设的基础上融合人工智能技术,深度探索投资、投教、投顾的差异化场景应用,吴珂皓表示:“毫无疑问,人工智能在具体金融服务场景中,能够极大的释放生产力,提高服务效率与服务水平。但是技术的成熟和运用的成熟之间,还有很长一段实践的路要走。”