蚂蚁集团多模态AI“灵光”上线
时间:2025-11-11 17:54:42 243浏览 收藏
蚂蚁集团近日推出全新多模态AI应用“灵光”,已在应用宝、vivo应用商店开启邀约内测。这款由支付宝(杭州)数字服务技术有限公司开发的应用,亮点在于其内置的“AGI相机”功能,能够通过相机镜头识别并理解现实场景,实现拍摄即问、实时理解与回答。业内人士认为,“灵光”在“认知层理解”上更具优势,或具备更强的场景分析与多模态推理能力。此前,蚂蚁集团已在多模态与AGI方向持续探索,并推出了全球首个模态支持上可媲美GPT-4o的开源模型Ming-Lite-omni-Preview,整合了语音、图像的生成与理解能力。
据新浪科技消息,近日,一款名为 “灵光” 的全新多模态应用已在腾讯应用宝、vivo 应用商店等平台悄然上线,并开启邀约内测。用户可通过手机号或支付宝账号直接登录体验。

据悉,“灵光”由 支付宝(杭州)数字服务技术有限公司开发,其最大亮点在于内置的 “AGI 相机” 功能。这一功能可通过相机镜头识别并理解现实世界中的场景与内容,实现拍摄即问、实时理解与回答。有业内人士指出,该功能与字节跳动的 豆包 App、阿里 元宝 App 的图像识别功能类似,但灵光更强调“认知层理解”,或具备更强的场景分析与多模态推理能力。
事实上,蚂蚁集团在多模态与 AGI 方向的探索已持续数月。今年4月底,蚂蚁首次实现了图像理解与生成的统一;5月份又推出了 Ming-Lite-omni-Preview 模型,这是全球首个在模态支持上可媲美 GPT-4o 的开源模型,具备语音、图像的生成与理解整合能力。
理论要掌握,实操不能落!以上关于《蚂蚁集团多模态AI“灵光”上线》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
460 收藏
-
263 收藏
-
162 收藏
-
376 收藏
-
405 收藏
-
215 收藏
-
462 收藏
-
188 收藏
-
288 收藏
-
137 收藏
-
199 收藏
-
273 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习