快手可灵上线图生视频与最长 3 分钟的视频续写功能

作者：沛霖（实习） 2024-06-21 05:06

感谢快手可灵新功能“图生视频”和“视频续写”今日上线。图生视频功能，支持将静态图像转化为 5 秒钟视频，用户可通过提示词文本控制图像中物体的运动；视频续写功能，支持对生成视频一键续写和连续多次续写，最长可生成约 3 分钟视频；此外文生视频新增 9:16 和 1:1 视频尺寸选择。 IT之家附快手可灵官方网站：，能够生成大幅度的合理运动，模拟物理世界特性。可灵使用了 DiT 架构，快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。在隐空间编 / 解码上，快手自研了 3D VAE 网络，实现时空同步压缩，

感谢快手可灵新功能“图生视频”和“视频续写”今日上线。

图生视频功能，支持将静态图像转化为 5 秒钟视频，用户可通过提示词文本控制图像中物体的运动；视频续写功能，支持对生成视频一键续写和连续多次续写，最长可生成约 3 分钟视频；此外文生视频新增 9:16 和 1:1 视频尺寸选择。

IT之家附快手可灵官方网站：https://kling.kuaishou.com/

快手可灵上线图生视频与最长 3 分钟的视频续写功能

可灵是由快手自研打造的视频生成大模型，能够生成大幅度的合理运动，模拟物理世界特性。

快手可灵上线图生视频与最长 3 分钟的视频续写功能

可灵使用了 DiT 架构，快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。

在隐空间编 / 解码上，快手自研了 3D VAE 网络，实现时空同步压缩，获得了较高的重建质量，在训练性能和效果之间取得了平衡。在时序信息建模上，快手设计了一款全注意力机制作为时空建模模块。

实测字节豆包·视频生成模型：Sora画的饼被实现了......

但更多的网友则是期待字节的视频生成模型，因为早在去年11月，字节的项目Make Pixels Dance就展示字节具备了解决长AI视频中角色一致性难以保持的问题。所以我也看到很多外网网友的另一个问题“Where is ByteDacne?”。而就在9.24火山引擎AI创新巡展深圳站上，火山引擎一口气发布了个视频生成模型PixelDance和Seaweed模型。

9/27/2024 5:55:00 PM

林杰鑫

快手All in AI视觉！成立可灵AI事业部，加速大模型商业化

4 月 30 日，快手发布组织架构调整公告，宣布正式成立可灵AI事业部，进一步强化其在人工智能领域的战略布局。公告显示，新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部，全面负责包括可灵、可图在内的系列大模型业务。快手高级副总裁盖坤将出任可灵AI事业部负责人，并继续兼任社区科学线负责人。

4/30/2025 6:00:51 PM

AI在线

可跨学科理解、多尺度建模，MIT LAMM发布微调的大语言模型 MechGPT

编辑 | 萝卜皮几个世纪以来，研究人员一直在寻找连接不同领域知识的方法。随着人工智能的出现，我们现在可以探索跨领域（例如，力学-生物学）或不同领域（例如，失效力学-艺术）的关系。为了实现这一目标，麻省理工学院（MIT）原子与分子力学实验室（Laboratory for Atomistic and Molecular Mechanics，LAMM）的研究人员使用了经过微调的大型语言模型 (LLM)，来获取多尺度材料失效的知识子集。该方法包括使用通用 LLM 从原始来源中提取问答对，然后进行 LLM 微调。由此产生的

11/15/2023 11:01:00 AM

ScienceAI

快手可灵上线图生视频与最长 3 分钟的视频续写功能

相关资讯

实测字节豆包·视频生成模型：Sora画的饼被实现了......

快手All in AI视觉！成立可灵AI事业部，加速大模型商业化

可跨学科理解、多尺度建模，MIT LAMM发布微调的大语言模型 MechGPT