首页 > 科技周边 > 人工智能

财跃星辰与上海财经联手打造的金融推理大模型Fin-R1

监督微调 (SFT): 使用ConvFinQA和FinQA数据集对基础模型进行微调，提升其金融推理能力。
强化学习 (RL): 使用GRPO算法，结合格式奖励和准确度奖励，并引入基于Qwen2.5-Max的模型验证器，进一步优化模型性能和稳定性。

时间：2025-04-07 12:54:37 353浏览收藏

上海财经大学人工智能金融实验室（SUFE-AIFLM-Lab）与财跃星辰联合推出金融推理大模型Fin-R1，该模型基于Qwen2.5-7B-Instruct架构，拥有70亿参数，在权威评测中排名第二，仅次于DeepSeek-R1。Fin-R1具备强大的金融推理与决策能力，支持中英文，可应用于金融合规检查、机器人投顾、量化交易、ESG分析等多个场景，并能辅助企业进行风险管理和投资决策。其轻量化设计降低了部署成本，高效且可靠，有望成为金融领域AI应用的重要驱动力。

Fin-R1：上海财经大学与财跃星辰合作推出的金融领域大型语言模型

Fin-R1是上海财经大学人工智能金融实验室（SUFE-AIFLM-Lab）与财跃星辰联合研发的首个金融领域R1类推理大模型。它基于Qwen2.5-7B-Instruct架构，拥有70亿参数，并经过两阶段训练：监督微调（SFT）和强化学习（RL），显著提升了其在复杂金融推理场景下的能力。在权威评测中，Fin-R1的平均得分达到75.2分，仅次于行业标杆DeepSeek-R1，排名第二。其训练数据包含约6万条高质量思维链（COT）数据，这些数据经过严格筛选，确保了模型的准确性和可靠性。

Fin-R1— 上海财经联合财跃星辰推出的金融推理大模型