当前,大语言模型在金融领域的应用正以前所未有的速度加速推进,深刻重塑着整个行业的格局。
3月31日,中关村论坛「人工智能主题日」核心论坛“AI未来论坛:创新·投资·全球化”在海淀区政府的主办下启幕。这场汇聚全球顶尖学者、行业领袖盛会,聚焦人工智能如何赋能未来经济,探讨技术与产业的深度融合。
论坛上,清华大学五道口金融学院副院长、金融学讲席教授、清华大学金融科技研究院副院长张晓燕发表了题为“大语言模型在金融领域的应用”的主题演讲。她从大模型的定义、技术演进、实际应用、现实挑战到未来趋势,剖析了这一技术如何深刻影响金融行业。
现场,张晓燕介绍了大模型在全球范围内的发展现状。她指出,大模型在提高工作效率和提升个性化服务方面表现出色。然而,另一方面,其也面临许多挑战,包括算力需求巨大、语料库质量参差不齐、伦理问题复杂以及监管政策尚未完善等。
会后,数据猿对张晓燕进行了专访。专访中,张晓燕围绕跨学科人才培养、监管创新等问题进行了深入的阐述。她提到,海淀区有人才、有产业、有资本,是大模型与金融场景融合发展的沃土,高校商学院应联动海淀区企业,培养懂技术、懂金融、懂产业的复合型人才。
大模型在金融领域的“新打法”“小模型”的潜力也不可忽视在2024年1月的达沃斯论坛上,国际专家曾提出一个严峻的假设:如果美国切断中国的算力供应,中国将如何应对?当时,这一问题被视为对中国技术自主性的考验。然而,DeepSeek的横空出世为这一假设提供了有力的回答。
张晓燕在会上提到,DeepSeek的问世,给我们注入了很大的自信心,我们通过技术创新,不仅解决了算力瓶颈问题,还找到了一个适合自己发展的道路。
在会上,她指出,大语言模型的传统路径依赖于超大规模参数量和海量数据的训练,展现了强大的语言理解和生成能力。然而,这种“常规打法”对算力和数据资源的需求极高,限制了其广泛应用。近年来,以DeepSeek为代表的新一代大模型通过技术创新,采用“混合专家架构”和混合精度训练技术,降低了训练成本和算力需求。这种“新打法”不仅打破了“高算力高成本”的固有认知,还为中国在大模型领域的快速发展提供了新的可能性。
“国家互联网信息办公室数据显示,中国从2023年8月登记的8个AI大模型,扩展到2024年12月的302个,发展迅猛。”张晓燕提到。同时,她指出,一个有趣的观察是,7 Billion(70亿)参数规模的模型数量最多,占所有发布大模型的26%。这表明,许多公司已经意识到小模型在大模型体系中的优势。因此,在关注大模型发展的同时,我们也不应忽视小模型的潜力和快速进步。
在金融领域,大语言模型的应用已从理论走向实践。截至今年3月,48家金融机构已完成DeepSeek的本地化部署,应用于投研决策、智能风控、服务优化和业务创新等场景。例如,张晓燕和她的团队在学术研究中聚焦于使用大模型从中文新闻文本中提取信号来预测中国A股市场中的股票回报。研究发现,所有基于大模型的投资组合累积收益均为正且持续增长,并且均超过市场表现。此外,本土化金融大模型的研发也取得了显著进展,以轩辕大模型、盘古大模型为代表的国产金融专用模型在多项金融任务评测中表现突出。同时,银行、券商、保险等金融机构也在积极部署大模型以实现智能化转型。
大模型竞争加速如何打破语料不足、人才缺乏等“卡脖子”问题?金融行业,作为数据密集型领域,首当其冲地感受到大模型带来的变革冲击。然而,技术的快速推进也伴随着一系列挑战,这些挑战不仅关乎技术本身,更涉及算力、语料、伦理、传播范式以及人才培养等多个维度。
在会上,张晓燕提到了几大挑战:
>挑战一:算力与语料的双重困境
AI的发展速度非常快,但全球高质量语料的增速正在放缓。自2010年以来,互联网语料的增长率已降至两位数,而到2028年,全球高质量语料可能面临枯竭。“对于中文大模型而言,语料不足的问题尤为突出。语料这个问题如何解决?我想目前还是悬而未决。”张晓燕说。
>挑战二:数据安全与道德伦理
随着AI技术的普及,数据安全和道德伦理问题愈发突出,尤其是在金融行业。网络攻击频发,金融领域的风险不断上升,而AI技术的偏见、歧视风险以及幻觉输出问题也引发了广泛争议。
例如,近期有患者携带大模型生成的医疗建议前往医院就诊,甚至比医生更“懂”病情。这种现象虽然新奇,但也暴露了大模型的局限性:其输出内容可能存在偏见、幻觉,甚至误导性。若公众过度依赖AI生成的信息,可能导致系统性风险。此外,算法的“黑箱”特性使得决策过程难以追溯,进一步加剧了监管责任界定的困境。解决这些问题需要技术、伦理和法律的协同努力。
>挑战三:信息传播
大模型正在改变金融信息的传播方式。传播主体的去中心化使得网络媒体突破了传统金融媒体的垄断,信息传播路径变得复杂且难以追踪。这种变化让每个人都需要自行判断信息的可信度,但同时也增加了市场操纵的风险。
>挑战四:人才短缺
AI技术的广泛应用导致人才需求激增,我国AI人才短缺问题严峻。张晓燕指出,培养跨学科复合型人才是当务之急。那么,金融与大模型交叉领域需要哪些新型能力?在数据猿的专访中,张晓燕指出,在金融与大模型的交叉领域,跨学科协作能力是关键。金融专家与AI工程师需具备跨学科写作能力,打破专业壁垒,形成协同闭环。“金融专家应深入理解大模型的技术特点及其在金融业务中的潜在应用场景,明确需求痛点和业务目标。与此同时,AI工程师则需具备一定的金融素养,能够将先进算法与金融场景有机融合,提升模型的适用性与精准度。”
“大模型”与“小模型”将相互协同共同驱动金融行业价值快速增长在人工智能技术的推动下,大语言模型正在迅速改变金融行业的运行逻辑和价值创造方式。会上,张晓燕从技术创新、行业价值增长以及模型协同三个维度,深入探讨大模型在金融领域的未来发展趋势,这些趋势不仅为行业带来了新的机遇,也为解决当前挑战提供了可能的路径。
>趋势一:金融领域大模型技术创新加速
金融行业对人工智能技术的依赖正在不断加深。近年来,金融领域的AI应用呈现出快速增长的趋势,相关专利申请数量持续上升,市场需求也在不断扩大。这种创新加速不仅体现在技术本身的进步上,还包括其在金融业务中的应用场景不断拓展。从风险评估到投资决策,从客户服务到产品创新,大模型正在成为金融行业不可或缺的技术支柱。未来,随着技术的进一步成熟和成本的降低,大模型的应用将更加广泛和深入,为金融行业带来更多的可能性。
>趋势二:大模型驱动行业价值快速增长
大模型在金融领域的应用不仅提升了效率,还显著推动了行业价值的增长。以智能投顾为例,大模型通过精准的客户画像和个性化的投资建议,显著提升了资产管理规模。据预测,到2024年,智能投顾的资产管理规模将达到2万亿美元,并在随后的几年中持续增长。这种增长不仅反映了大模型在提供定制化服务方面的优势,也预示着其在推动金融行业数字化转型中的重要作用。未来,随着大模型技术的进一步发展和应用的深化,金融行业的价值创造能力将进一步提升,为客户提供更加优质和高效的服务。
>趋势三:“大模型”与“小模型”协同开启金融智能化新篇章
在全球范围内,各国在AI发展路径上各有特色。大模型通常拥有超过10亿的参数,计算资源需求高、成本较大;而小模型参数数量较少,运行效率高、成本低,且易于部署和更新。在实际应用中,小模型能够快速响应并解决具体问题,因此在许多场景中具有独特优势。未来,大模型与小模型的协同应用将成为金融智能化发展的重要趋势,为行业提供更加灵活和高效的解决方案。
高校应联动海淀区企业培养复合型人才在当今全球化的背景下,人工智能技术的迅猛发展为金融行业带来了前所未有的机遇,同时也对监管体系提出了新的挑战。张晓燕在专访中指出,金融监管应与科技创新同频共振,既要保护创新,又要筑牢安全底线。
张晓燕强调,在金融创新与监管的动态平衡中,监管部门需防止“过度监管”束缚创新,同时避免“监管滞后”引发系统性风险。她建议建立动态监管机制,通过持续监测市场变化,及时消除监管空白和盲区。例如,推广“监管沙箱”机制,允许金融机构和科技企业在受控环境中测试创新产品,确保创新与安全同步推进。此外,利用大数据和人工智能技术提升监管效能和精准性,通过实时数据分析和风险预警,增强金融系统的稳定性。
随着数字技术的普及,需警惕“数字鸿沟”和“算法歧视”带来的社会不平等问题,特别是老年人和弱势群体的金融服务可及性。同时,加强信息披露和数据安全保护,增强消费者对金融创新产品的信任,使科技真正服务于经济和社会发展。
张晓燕还提到,海淀区在推动大模型与金融场景融合方面具有独特优势。海淀区拥有丰富的高校资源,如清华大学、北京大学等,21所高校获批人工智能本科专业,拥有1.23万人工智能学者。产业方面,海淀区通过惠企政策培育了1300余家人工智能企业,相关企业和人才数量占北京七成左右。金融方面,海淀区聚集了1754家金融机构,中关村科学城成长基金规模扩容至100亿元。
值得一提的是,清华大学五道口金融学院设立了全国首个技术转移金融专业硕士项目,旨在培养既懂技术又懂金融的复合型国际化人才,推动科技成果转化与产业落地。项目毕业生已主导成立8家初创公司,设立科创基金规模超190亿元,推动多项科创项目落地北京。
大模型重塑金融,关键不在技术本身,而在于能否构建起理解它、驾驭它、融合它的复合型人才体系。真正的竞争,不是参数的比拼,而是认知的升级、协同的能力与制度的革新。站在AI与金融融合的拐点,教育、产业与监管唯有同频共振,方能共塑未来。