首页 > 科技周边 > 业界新闻

阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频

来源：IT之家

时间：2024-04-30 15:21:29 435浏览收藏

golang学习网今天将给大家带来《阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频》，感兴趣的朋友请继续看下去吧！以下内容将会涉及到等等知识点，如果你是正在学习科技周边或者已经是大佬级别了，都非常欢迎也希望大家都能给我建议评论哈~希望能帮助到大家！

“本站4月25日消息，EMO（Emote Portrait Alive）是一个由阿里巴巴集团智能计算研究院开发的框架，一个音频驱动的AI肖像视频生成系统，能够通过输入单一的参考图像和语音音频，生成具有表现力的面部表情和各种头部姿势的视频。”

阿里云今日宣布，通过实验室研发的 AI 模型 —— EMO 正式上线通用 App，并开放给所有用户免费使用。借助这一功能，用户可以在歌曲、热梗、表情包中任选一款模板，然后通过上传一张肖像照片就能让 EMO 合成演唱视频。

根据介绍，通义 App 首批上线了80多个 EMO 模板，包括热门歌曲《上春山》《野狼 Disco》等，还有网络热梗“钵钵鸡”“回手掏”等，但目前暂未提供自定义音频。

本站附 EMO 官网入口：

EMO 的主要特点

本篇关于《阿里云宣布自研 EMO 模型上线通义 App，用照片 + 音频生成唱歌视频》的介绍就到此结束啦，但是学无止境，想要了解学习更多关于科技周边的相关知识，请关注golang学习网公众号！

阿里巴巴

声明：本文转载于：IT之家如有侵犯，请联系study_golang@163.com删除