环球时讯:度小满开源国内首个千亿参数金融大模型“轩辕”
(资料图)
近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。
在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。
为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。
BLOOM (Big Science Language Open-science Open-access Multilingual)是2021年由 1000 多名志愿研究人员在一个名为“大科学 BigScience”的项目中创建,2022年 7 月 12 日正式发布。BLOOM 拥有 1760 亿个参数(决定输入数据如何转换为输出内容的变量),稍多于拥有 1750 亿个参数的 GPT-3。BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。相比Meta发布的130亿参数的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更占优势。
目前,千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。
度小满CTO许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。
作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。轩辕大模型开源后,对金融机构有何意义?
许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位的提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。
度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,能够将征信报告解读出40万维的风险变量,更好的识别小微企业主的信贷风险。今年5月份,这一工程荣获了 “吴文俊人工智能科学技术奖”。今年2月份,百度基于文心大模型技术推出的生成式对话产品“文心一言”(英文名:ERNIE Bot)开放生态合作,度小满成为首家接入的金融科技公司。
(文章来源:界面新闻)
标签:
相关文章
环球时讯:度小满开源国内首个千亿参数金融大模型“轩辕”
近日,度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型
美军“华盛顿”号航母推迟数年后完成大修|今日快讯
参考消息网5月25日报道据美国《军队时报》网站5月24日报道,“乔治·华盛顿”号航母23日在弗吉尼亚州的纽波
新能源车大战中,谁急了?-焦点讯息
近日,长城汽车(行情601633,诊股)(02333 HK)举报比亚迪(行情002594,诊股)(01211 HK)的事件迎来新进展。
焦点信息:“容缺办”措施便利驾照期满换证注意!6月30日前及时补交身体条件证明
市公安局交警总队介绍,本市公安交警部门在2022年3月21日至7月21日和2023年1月7日至2023年3月31日期间,推
京牌小客车可以向谁转移登记?怎样查进展?最新提示-世界时讯
今天,北京市小客车指标调控管理办公室发布《关于亲属关系核查有关工作的说明》,就2023年积分排序入围的家
白玉兰奖入围名单揭晓,《人世间》《狂飙》等入围最佳电视剧
上海电视节今天公布第28届上海电视节白玉兰奖入围名单,大热剧《功勋》《开端》《狂飙》《人世间》《县委大
中汽协:4月中国品牌乘用车销售同比增长81.4% 全球快消息
中汽协:4月中国品牌乘用车销售同比增长81 4%;据中国汽车工业协会统计分析,2023年4月,中国品牌乘用车销
世界快播:2023年光伏辅材行业专题报告(中游篇) 浆料是电池制备中使用的核心辅材
电池片环节光伏辅材梳理光伏电池发电原理与分类光伏发电的基本原理是利用半导体的光生伏特效应(Photovolta
【环球速看料】上海市文化和旅游局:优化文旅供给 强化市场治理 全力推动文旅消费量的增长和质的提升
据上海市文化和旅游局消息,5月25日下午,上海市文化和旅游局召开全市文化和旅游市场管理座谈会,强调抢抓
十四部门联合印发意见 部署推进新一轮电信基础设施共建共享工作
新华社北京5月25日电(记者魏弘毅、张辛欣)近日,工业和信息化部等十四部门联合印发《关于进一步深化电信
oppo手机耗电量太快怎么解决(手机耗电量太快怎么办?)|全球观天下
相信目前很多小伙伴对于手机耗电量太快怎么办?都比较感兴趣,那么小搜今天在网上也是收集了一些与手机耗电
全球新消息丨无冬online_关于无冬online介绍
无冬online,关于无冬online介绍这个很多人还不知道,现在让我们一起来看看吧!1、《无冬online》是由完
意杯-劳塔罗双响巴雷拉助攻 国米2-1佛罗伦萨卫冕成功
2023年5月25日凌晨3点,2022-2023赛季意大利杯迎来最后的决赛大战,国际米兰对阵佛罗伦萨。上半场开场仅仅3
美国债务上限逼近“悬崖” 两党谈判成赌博闹剧|每日快报
美国债务上限逼近“悬崖”两党谈判成赌博闹剧---05浏览量262697美国债务上限已逼近“悬崖”边缘,违约风险
浙江浦山村:从“七彩畲乡”到“亲子乐园” 美丽乡村带动美丽经济
5月24日拍摄的浙江省龙游县浦山村入口处一景。近年来,浙江省衢州市龙游县詹家镇浦山村在深化“千万工程”
【全球新要闻】“黑科技”上线 隧道抛洒物“秒”处理
“老营盘五号隧道石城方向K481+415处有抛洒物,请养护人员立即前往处理。”省交通投资集团吉安东管理中心应