首页 > 科技周边 > 人工智能

云从科技多模态AI上线，从容大模型来袭

时间：2025-06-27 14:53:53 366浏览收藏

从现在开始，努力学习吧！本文《从容大模型上线，云从科技多模态AI来袭》主要讲解了等等相关知识点，我会在golang学习网中持续更新相关的系列文章，欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧，希望能帮到你！

从容大模型是什么

从容大模型是由云从科技研发的多功能AI模型。该模型在OpenCompass多模态榜单上以80.7分的成绩位居榜首，超越了谷歌、OpenAI等知名机构。从容大模型专注于通用视觉语言理解和推理任务，通过多模态对齐、决策类人化、高效工程优化以及原生多模态推理等技术革新，确立了其在全球范围内的领先地位。从容大模型已在医学健康、数理逻辑、艺术设计等领域展现出卓越性能，并在金融、制造、政务等行业实现了广泛应用，推动了智能化进程。

从容大模型的核心功能

视觉感知与认知理解：能够处理并理解图像和视频等视觉信息，在医学健康、艺术设计等领域表现出色，可解析复杂的视觉情境。
跨领域适用性：在数理逻辑、医学健康、艺术设计等专业领域具备强大的理解和推理能力。
复杂场景文本识别：擅长于复杂环境下进行文本识别（如OCRbench），可以处理高分辨率图像及文档（如合同、发票表格等），支持智能审查、智能解析、智能问答等功能。
开放域问答：在开放域问答（如MMVet）中表现优秀，能给出精确且深入的回答。

从容大模型的技术核心

多模态对齐：创建高质量的多任务场景基准数据集，利用强化指令对齐来增强模型对多模态数据的理解与推理能力。结合DPO和GRPO技术改进学习流程，使模型更加接近人类思维方式做出决策推理，无需依赖奖励模型即可实现类人化推理决策。
高效工程优化：针对高分辨率图像和多模态文档理解任务，优化图像编码器结构，提高处理高分辨率图像和复杂文档的能力。加强模型上下文建模能力，准确跟踪长文本中的逻辑联系，支持跨页文档分析和多轮对话等任务。
原生多模态推理：更新模型架构，应对多图、跨图情况下的图文交错模式和原生视频模式，完成复杂的多模态任务，比如跨图对比、图文组合推理、多图问答等。

从容大模型的实际应用

金融风控：与银行合作开发风控AI智能体，自动识别风险，减少投诉数量。
智能客服：为电商平台搭建智能客服系统，提高问答准确性和服务效率。
医学健康：分析医学影像资料，协助医生诊断，增加诊断精确度和速度。
政务管理：处理政府文件，实现智能审核和咨询，改善公共服务质量。
制造业：应用于产品质检环节，提高生产效率和产品质量。

文中关于的知识介绍，希望对你的学习有所帮助！若是受益匪浅，那就动动鼠标收藏这篇《云从科技多模态AI上线，从容大模型来袭》文章吧，也可关注golang学习网公众号了解相关技术文章。