浙江大学联合摸象科技共同发布垂直金融零售领域的语言大模型——智海-金磐大模型
(一)
2023年8月21日,在由中国工程院院刊《Engineering》、中国人工智能学会和中国工程院信息学部分刊《Frontiers of Information Technology & Electronic
Engineering》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛上,浙大发布了系列 AI+X:各行业垂直领域基座模型,其中,垂直于零售金融的【智海-金磐】语言大模型尤其引起了业内关注。
2023年6月麦肯锡发布的《生成式人工智能的经济潜力》研究报告指出:银⾏业、⾼科技和⽣命科学等⾏业可能会受到来⾃生成式AI的影响最⼤。银行业是一个知识和技术驱动的行业,该技术可以带来的价值相当于每年额外增加 2000 亿⾄3400 亿美元。
中国银行业的AIGC需要立足于国产自研的金融垂直大模型。近日,摸象科技和浙大人工智能研究所联合研发中国首个垂直金融零售的语言大模型-【智海-金磐】大模型,目前模型基座7B,即将扩展到13B,在超过60个使用描述模板的数据集上进行微调,训练数据来源于金融语料、金融行业公开信息及银行提供的专业金融知识库,训练用的高质量数据集涵盖了金融知识图谱、金融文本、金融对话等多种数据源,数据集为百亿级。金磐大模型是一个集场景识别、语义理解及智能对话的深度语言大模型系统,能够实现对金融场景的精准理解和响应,为金融机构提供高效、智能、可信赖的语言服务,包括金融知识问答、金融文本生成、金融对话机器人等多种应用场景。
【智海-金磐】寓意坚固的金融智能,并同时具有无限的可能性和创造力。展示了这个语言大模型的特点和优势,即能够充分适应金融行业的安全需求,提供坚实稳固的AI能力。
【智海-金磐】大模型是是摸象科技和浙江大学在金融智能领域的重要成果,基于浙大在自然语言处理、知识图谱、神经网络、机器学习等领域的前沿研究,结合金融零售业务的实际需求,构建了这个面向金融零售的垂直大模型,其具有以下特点:
1) 支持金融行业客户私有化部署,满足数据安全合规要求。
2)具有大模型的基础能力和较强的金融领域泛化能力,同时模型体积小,参数量适中,单个金融企业有限算力可以承载。
3)模型具有灵活迁移的能力,垂直训练后能够方便地嵌入生产场景赋能应用并提升效率。
4)能够支撑上层应用对模型进行精调,并以MaaS的模式为客户提供解决方案。
【智海-金磐】大模型主要应用的银行零售场景包括:
1)在线咨询场景。语言大模型可以作为银行的在线客服,通过网站、APP、微信等渠道,与客户进行实时的对话,回答客户的各类金融问题,如账户管理、产品介绍、业务办理等,提高客户的满意度和忠诚度。
2)智能推荐场景。语言大模型可以根据客户的特征、偏好、需求、风险承受能力等数据,为客户提供个性化的金融产品推荐,如存款、贷款、基金、保险等,提高客户的转化率和留存率。
3)投资顾问场景。语言大模型可以根据客户的投资目标、资产配置、收益预期等数据,为客户提供专业的投资组合建议,如股票、债券、期货、期权等,提高客户的收益率和风险控制能力。
在中国,金融领域有强数据安全和合规应用要求,因此不能通过互联网API等公有云方式调用大模型,大模型面临私有化部署到金融企业体内的问题,因此金融行业需要建立研发垂直金融的中型模型,百亿级参数,用于高频的金融核心业务,尤其是零售场景。【智海-金磐】大模型作为中国第一个垂直金融零售领域研发的大模型,将利用大数据和人工智能技术,为金融零售领域提供智能化、个性化、高效化的解决方案,提升金融服务的质量和覆盖度,降低金融风险和成本,促进金融普惠和创新。
(二)
摸象科技是一家浙大系AI科技公司,创始人高鹏博士师从潘云鹤院士,是中国唯一专注于银行场景做垂直金融大语言模型(LLM)和大规模预训练AI员工的科技公司。自主研发大规模预训练的金融零售大模型-金磐大模型,为中国的2000+银行提供高智能的AI员工,目前相当于入行1-3年客户经理的智能水平,可应用于银行的智能外呼、网点直营、远程银行、员工咨询、培训和辅助、APP数字人等场景,嵌入在工作流程中,以对话的形式协助银行完成营销和推荐服务。
截止到2022年底,公司已与中国建设银行、工商银行、中国银行、邮储银行、邮政金融、浦发银行、光大银行、兴业银行、华夏银行、渤海银行等客户合作,目前已有8000名AI员工,每年提供4亿次以上AI智能对话服务,帮助银行智能化降本增效。
自2018年以来,摸象科技持续投入基于谷歌Bert模型的AI员工研发,进行预训练金融业务的理解和决策,但AI员工反馈的答案仍基于标准知识图谱。自2022年底以来,摸象科技联合浙大人工智能所共同投入研究金融领域大语言模型,涵盖从海量数据清洗处理、预训练、监督微调、奖励模型反馈到金融领域应用落地的全链路技术体系,运用模型量化、模型剪枝、模型蒸馏等方法进行模型压缩,提升模型计算效率,使其具有大模型的基础能力和较强的金融领域智能水平,满足单个金融企业有限算力要求。突破分布式异构算力集群资源调度技术,实现跨集群、跨平台、跨场景的资源调度,提升集群计算效率;研发模型高效推理框架,实现多种终端的高效推理计算。
2023年6月麦肯锡发布的在应用场景上,金融零售其实是天然的AIGC场景,未来大模型的竞争就是AIGC场景入口的竞争。对于银行客户经理来说,核心的工作就是销售和转化客户。下一代AI将会被集成到现有工作流中,帮助客户经理更加高效的处理客户触达、联系、销售的整个业务闭环。生成式AI和配置式NLP的区别以生成式AI为基础的对话机器人,和传统配置式NLP机器人是不同的,生成式AI基于金融大规模数据集的学习后,主要区别在于经过了大规模训练后AI具有策略智能,可根据不同语境和意图结合输出应对策略,生成对话结果,因此机器人有“随机应变”的智慧,可用于营销场景,大大提高银行线上互动营销的效率。
目前摸象科技已经拥有包括AI助手、AI员工、AI数字人等多个成熟产品,可快速实现大模型落地后的产品化、工程化,全面应用在中国的各银行零售场景,据测算,每100个AI员工与客户经理协同经营长尾客户后,可为银行带来近20亿元的资产提升。有了国产自主可控大模型之后,大模型赋能的高智能AI员工广泛参与银行运营整个流程,可极大的缓解银行“管户人力不足、长尾客户缺乏经营”的困境,帮助银行降本增效,进入AI+人工的零售经营新范式。
(三)
浙江大学上海高等研究院常务副院长、浙江大学人工智能研究所所长吴飞教授介绍说,浙大立足于“AI+X垂直领域大模型”的大模型技术前沿,基于浙大团队在垂直领域大模型的研究现状及基座能力,基于先期落地的业界首个端到端、通用型、规模化产业应用的端云协同模型训练系统,推出了【智海】系列的垂直大模型。除了与摸象科技合作推出【智海-金磐】金融垂直大模型赋能银行之外,浙大还与阿里巴巴达摩院合作,在阿里巴巴司法领域垂直大模型LegalMind基础上,与浙江大学上海高等研究院、浙江大学计算机学院和法学院与阿里巴巴达摩院正在打造更轻量级司法垂直领域大模型【智海-录问】;与高等教育出版社、华院计算等合作,在新一代人工智能系列教材基础上,以教科书级高质量语料正在打造【智海-三乐】人工智能领域教育大模型,以“教材建设、课程共享和平台增效”三位一体形成数字化和智能化的教学基座能力,赋能101计划核心课程《人工智能引论》的教学育人。