首页 > 科技周边 > 人工智能

点击即动，腾讯混元携手清华、港科大推出"Follow Your Click"视频大模型

来源：51CTO.COM

时间：2024-03-20 22:09:12 208浏览收藏

腾讯混元携手清华大学、香港科技大学联合发布全新图生视频大模型“Follow-Your-Click”。该模型基于输入图片，用户只需点击对应区域并提供少量提示词，即可将图片中静态区域转换成视频。与现有图生视频大模型相比，Follow-Your-Click更具实用性和可控性，用户只需通过简单交互即可指定移动图像的特定部分，生成视频更加精准灵活。

编辑 | 言征

出品 | 51CTO技术栈（微信号：blog51cto）

3月15日，腾讯混元和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“，基于输入模型的图片，只需点击对应区域，加上少量提示词，就可以让图片中原本静态的区域动起来，一键转换成视频。

一键点、万物动！腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”

当前的图生视频大模型中，一般的生成方法不仅需要用户在提示词中描述运动区域，还需要提供运动指令的详细描述，过程较为复杂。另外，从生成的效果来看，现有图像生成视频技术在移动图像的指定部分上缺乏控制，生成的视频往往需要移动整个场景，而不是图像上的某一个区域，精准度和灵活性上有所欠缺。

为了解决这些问题，腾讯混元大模型团队、清华和港科大的联合项目组提出了更实用和可控的图像到视频生成模型Follow-Your-Click，带来更加便捷的交互，也让图片“一键点，万物动”成为现实。

一键点、万物动！腾讯混元联合清华、港科大推出图生视频大模型“Follow Your Click”

图像到视频生成的技术在电影内容制作、增强现实、游戏制作以及广告等多个行业的AIGC应用上有着广泛前景，是2024年最热门的AI技术之一。

据了解，本联合项目组中的腾讯混元大模型团队，正在持续研究和探索多模态技术，拥有行业领先的视频生成能力。此前，腾讯混元大模型作为技术合作伙伴，支持《人民日报》打造原创视频《江山如此多娇》，生成中国大美河山的精美视频片段，展示出了较强的内容理解、逻辑推理和画面生成能力。

论文链接：https://arxiv.org/abs/2403.08268

Github：https://follow-your-click.github.io/

今天关于《点击即动，腾讯混元携手清华、港科大推出"Follow Your Click"视频大模型》的内容介绍就到此结束，如果有什么疑问或者建议，可以在golang学习网公众号下多多回复交流；文中若有不正之处，也希望回复留言以告知！

模型清华腾讯

声明：本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除