登录
首页 >  科技周边 >  人工智能

智驾公司下场搞AI视频生成,模型上线即开源

时间:2025-01-01 11:25:07 447浏览 收藏

本篇文章向大家介绍《智驾公司下场搞AI视频生成,模型上线即开源》,主要包括,具有一定的参考价值,需要的朋友可以参考一下。

OpenAI 和谷歌在AI领域持续发力,OpenAI 推出Sora,谷歌推出Veo2,但Sora的高昂价格和Veo2的封闭测试引发热议。 与此同时,一家中国公司图森未来却选择开源其图生视频大模型——Ruyi。

图片

Ruyi-Mini-7B版本已可在Hugging Face平台下载:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B GitHub代码链接:https://github.com/IamCreateAI/Ruyi-Models 官方还提供部署说明和ComfyUI工作流,支持消费级显卡运行。

图片

官方Demo展示了Ruyi强大的生成能力,包括逼真的写实人物、动画角色和自然风景等:

图片图片图片图片

Ruyi性能测试:

Ruyi基于单张图片即可生成最高720P、时长5秒的视频,支持任意长宽比。 它支持多起始帧和结束帧,可生成任意长度视频,并提供运动幅度和镜头控制选项。

图片智驾公司下场搞AI视频生成,模型上线即开源 图片

在写实风格、影视剧照、动画风格、动物和风景等方面,Ruyi展现了不错的生成能力,但仍存在一些不足,例如手部畸形和细节缺失。

图片图片图片图片图片图片图片图片智驾公司下场搞AI视频生成,模型上线即开源 图片智驾公司下场搞AI视频生成,模型上线即开源

图森未来转型:

图森未来,一家原智能驾驶公司,于今年8月进军ACG市场,并成立生成式AI部门。Ruyi的开源,体现了其将自动驾驶技术经验应用于AI生成领域的策略。

Ruyi基于DiT架构,参数量约7.1B,训练数据约200M个视频片段。 图森未来计划于2025年推出闭源模型Ruyi Standard及相关工具,2026年发布更强大的版本。

图片图片

视频链接:https://mp.weixin.qq.com/s/Ojt7YpHUprIBFHFdsbBY8w

以上就是《智驾公司下场搞AI视频生成,模型上线即开源》的详细内容,更多关于产业的资料请关注golang学习网公众号!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>