阿里通义万相 2.1 模型升级的新闻报道,以下是对该新闻的核心内容介绍:
阿里通义万相 2.1 模型升级亮点
- 视频生成能力显著提升:
- 时空上下文建模能力增强:通过自研的高效 VAE 和 DiT 架构,支持无限长 1080P 视频的高效编解码,能够更精准地处理视频中的时间和空间信息,使生成的视频在流畅度和连贯性上更上一层楼。
- 首次实现中文文字视频生成功能:登上 VBench 榜单第一,打破了以往在中文视频生成领域的局限,为中文内容创作者提供了更强大的工具。
- 支持中英文视频生成:一键生成艺术字,还提供多种视频特效选项,如过渡、粒子效果、模拟等,可增强视觉表现力,满足不同场景和风格的视频创作需求。
- 支持复杂运镜:能够还原碰撞、反弹、切割、挤压等真实世界的物理规律,让生成的视频画面更加真实、生动,例如雨滴落在伞上会溅起水花等效果,提升了视频的质感和观赏性。
- 图片生成能力升级:
- 支持文生组图:采用 IC-LoRA 图像生成训练方法,利用 DiT 架构,增强文本到图像的上下文能力。通过对多张图像进行拼接与联合描述,可实现关联图像间的组合生成,并保持特征稳定连续,为用户提供了更灵活、丰富的图片创作方式,能够根据文本描述生成具有连贯性和关联性的多张图片。
应用场景示例
- 视频生成示例:
- 东方韵味的“福”字视频:以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画边缘模糊且自然,随着晕染的进行,水墨在纸上呈现“福”字,墨色从深到浅过渡,呈现出独特的东方韵味。背景高级简洁,有杂志摄影感。
- 雨中夫妇视频:一对穿着正式晚礼服的夫妇在回家途中遭遇大雨,他们撑着黑色雨伞。平拍镜头下,男士穿着黑色西装,女士穿着白色长裙。他们在雨中缓缓行走,雨水沿着伞面滴落。镜头跟随他们的步伐平稳移动,展现出他们在雨中的优雅姿态。
- 图片生成示例:浪漫的公园里,一对青年男女在温馨的拥抱交谈。
其他信息
新闻中还包含广告声明,提到文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...