LinGen是由普林斯顿大学与Meta联合开发的一种全新的文本生成视频框架。该框架采用线性复杂度的MATE模块(包含MA-branch和TE-branch),取代传统DiffusionTransformers中计算复杂的自注意力机制,从而实现在单个GPU上高效生成高分辨率、长时间段的视频内容。LinGen在降低计算开销的同时保持高质量输出,在视频质量和生成效率方面均优于现有先进模型,为长视频生成及实时交互式应用提供了新方向。LinGen的核心功能高分辨率视频生成:支持生成如512p、1024p等高清视频