AIGC宇宙 AIGC宇宙

快手可灵上线图生视频与最长 3 分钟的视频续写功能

感谢快手可灵新功能“图生视频”和“视频续写”今日上线。图生视频功能,支持将静态图像转化为 5 秒钟视频,用户可通过提示词文本控制图像中物体的运动;视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。 IT之家附快手可灵官方网站:,能够生成大幅度的合理运动,模拟物理世界特性。可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,
感谢快手可灵新功能“图生视频”和“视频续写”今日上线。

图生视频功能,支持将静态图像转化为 5 秒钟视频,用户可通过提示词文本控制图像中物体的运动;视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。

IT之家附快手可灵官方网站:https://kling.kuaishou.com/

快手可灵上线图生视频与最长 3 分钟的视频续写功能

可灵是由快手自研打造的视频生成大模型,能够生成大幅度的合理运动,模拟物理世界特性。

快手可灵上线图生视频与最长 3 分钟的视频续写功能

可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。

在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,获得了较高的重建质量,在训练性能和效果之间取得了平衡。在时序信息建模上,快手设计了一款全注意力机制作为时空建模模块。

相关资讯

实测字节豆包·视频生成模型:Sora画的饼被实现了......

但更多的网友则是期待字节的视频生成模型,因为早在去年11月,字节的项目Make Pixels Dance就展示字节具备了解决长AI视频中角色一致性难以保持的问题。 所以我也看到很多外网网友的另一个问题“Where is ByteDacne?”。 而就在9.24火山引擎AI创新巡展深圳站上,火山引擎一口气发布了个视频生成模型PixelDance和Seaweed模型。
9/27/2024 5:55:00 PM
林杰鑫

快手All in AI视觉!成立可灵AI事业部,加速大模型商业化

4 月 30 日,快手发布组织架构调整公告,宣布正式成立可灵AI事业部,进一步强化其在人工智能领域的战略布局。 公告显示,新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部,全面负责包括可灵、可图在内的系列大模型业务。 快手高级副总裁盖坤将出任可灵AI事业部负责人,并继续兼任社区科学线负责人。
4/30/2025 6:00:51 PM
AI在线

可跨学科理解、多尺度建模,MIT LAMM发布微调的大语言模型 MechGPT

编辑 | 萝卜皮几个世纪以来,研究人员一直在寻找连接不同领域知识的方法。随着人工智能的出现,我们现在可以探索跨领域(例如,力学-生物学)或不同领域(例如,失效力学-艺术)的关系。为了实现这一目标,麻省理工学院(MIT)原子与分子力学实验室 (Laboratory for Atomistic and Molecular Mechanics,LAMM)的研究人员使用了经过微调的大型语言模型 (LLM),来获取多尺度材料失效的知识子集。该方法包括使用通用 LLM 从原始来源中提取问答对,然后进行 LLM 微调。由此产生的
11/15/2023 11:01:00 AM
ScienceAI
  • 1