Sora

超10秒高分辨率，北大Open Sora视频生成更强了，还支持华为芯片

北大团队联合兔展发起的 Sora 复现计划，现在有了新成果。OpenAI 在今年年初扔出一项重大研究，Sora 将视频生成带入一个新的高度，很多人表示，现在的 OpenAI 一出手就是王炸。然而，众多周知的是，OpenAI 一向并不 Open，关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初，北大团队联合兔展启动了 Sora 复现计划 ——Open Sora Plan，该项目希望通过开源社区的力量复现 Sora。项目上线一个月，星标量已经达到 6.6k。项目地址

4/8/2024 2:50:00 PM

机器之心

攻陷短视频后，Sora将需要72万块H100 GPU

在被大规模采用后，Sora 的推理成本将很快超过训练成本。OpenAI 推出的 Sora 模型能够在各种场景下生成极其逼真的视频，吸引了全世界的目光。近日，投资机构 factorial funds 发表了一篇博文，深入探讨了 Sora 背后的一些技术细节，并对这些视频模型可能产生影响进行了探讨。最后，文中还讨论了对用于训练 Sora 等模型的算力的看法，并对训练计算与推理计算的算力比较进行了预测，这对估计未来 GPU 需求具有重要意义。机器之心对此文进行了整理。本报告的主要调查结果总结如下：Sora 是一个建立在扩

4/6/2024 11:51:00 PM

机器之心

在好莱坞发动“魅力攻势”，消息称 OpenAI 向派拉蒙、环球等影业巨头展示 Sora

感谢据英国《金融时报》报道，OpenAI 近期在好莱坞发动了一场“魅力攻势”—— 与派拉蒙、环球和华纳兄弟探索等主要电影公司举行会议，展示其视频生成技术 Sora，并缓解对人工智能模型将损害电影行业的担忧。报道援引多位知情人士消息称，OpenAI 首席执行官山姆・阿尔特曼和首席运营官布拉德・莱特凯普在近期数日间举行的会议上，向影业巨头高管们做了 Sora 的产品介绍。参与会议的人员表示，OpenAI 正在就如何推出 Sora 寻求影业高管们的意见。一些观看了演示的人说，他们可以看到 Sora 或类似的人工智能产品如

3/29/2024 5:35:09 PM

清源

视觉盛宴！7位顶级艺术家最新 Sora 作品震撼发布！

昨天早上 Open AI 终于放出最新的七部 Sora 视频作品，基于最近有测试名额的世界顶级艺术家创作生成。七部 AI 短片，加上配音和旁白，效果真的很惊艳！相比 2 月 Sora 发布的 48 个视频，果然艺术家创作者会让视频变成故事，更打动人。至此在 2 月 16 日 Sora 发布后，同一天 Open AI 在 Tiktok 上开了账号每天会发布内部制作的 Sora 视频。目前已经发布 65 个视频作品，吸引 270.3K 位粉丝。接下来让我们一起看看这七部作品吧。一、shy kids – “Air He

3/28/2024 8:40:39 AM

yaoyao

实名羡慕！这些人已经用上了Sora

Sora 第三方口碑出炉，或许带给艺术家们最大的好处是：让他们的想象力、创造力更少地受到技术层面的限制。自 OpenAI 推出 Sora 以来，一直是该团队的成员放出演示视频，何时向公众开放测试我们不得而知。Sora 的初体验到底如何？或许艺术家、创意家、导演等公众人物的试用点评值得大家参考。今早，OpenAI 首次展示了一些 Sora 生成的作品，这些作品是获得 Sora 访问权限的电影制作人、艺术家、广告公司和音乐家制作完成的。以下是艺术家作品的一些示例，以及他们对 Sora 如何融入其工作流程和业务的早期想法

3/27/2024 10:59:00 AM

机器之心

再谈复现 Sora：被仰望与被遗忘的

2月16日，OpenAI 发布了视频生成领域的重磅模型 —— Sora。Sora 对 Scaling Law 的信仰及其突破性的技术创新，使它持续保持领先地位。同时，也再次证明了“大力出奇迹”依然适用于文生视频领域。Sora 披露的技术细节，远远不足以窥其全貌。同时 Sora 目前也未正式对外开放。源于此，针对 Sora 的思考和讨论从未停止过。 OpenAI 发布的技术报告Sora 给整个 AI 领域带来的最大冲击，莫过于如何优化和校正现有的视频生成思路和

3/27/2024 10:51:00 AM

机器之心

OpenAI 邀请艺术家们试用文生视频工具 Sora：气球脑袋、会飞的猪

感谢近日，OpenAI 公司近日邀请部分艺术家试用了其人工智能视频创作工具 Sora。通过使用 Sora，艺术家们创作了一系列惊艳的实验性短片，将人工智能的强大和新奇展现得淋漓尽致。与我们熟悉 OpenAI 的聊天机器人 ChatGPT 和图片生成平台 DALL-E 不同，Sora 目前仍未面向大众开放。本周一，OpenAI 公司在其博客中发布了一篇名为“Sora：第一印象”的文章，展示了视觉艺术家、设计师、创意总监和电影制作人使用 Sora 创作的成果。这些短片时长从 20 秒到一分半不等，画面精美绝伦，

3/26/2024 4:22:18 PM

远洋

OpenAI进军好莱坞：电影制作用Sora指日可待

OpenAI 的野心可不仅限于在 TikTok 上发短视屏。自从 OpenAI 推出自动生成视频的 Sora 以后，很多人预测好莱坞可能要被 AI 代替了。现在，这家公司可能真的要走上这条路了。彭博社本周五报道，有知情人士透露，OpenAI 计划下周在洛杉矶与好莱坞电影公司、媒体高管和人才机构举行会议，以在娱乐行业建立合作伙伴关系，并鼓励电影制作人将其新的人工智能视频生成器整合到他们的工作中。一些不愿透露姓名的人士表示，即将举行的会议是 OpenAI 最近几周新一轮外展活动的组成部分。2 月底，OpenAI 安排在

3/25/2024 10:58:00 AM

机器之心

消息称 OpenAI 将与好莱坞电影公司会面并推荐 Sora

感谢据彭博社报道，OpenAI 计划下周在洛杉矶与好莱坞电影公司、媒体高管和人才经纪公司举行会议。知情人士透露，本次会议计划建立娱乐行业的合作伙伴关系，并鼓励电影制作人将其新的人工智能视频生成器整合到他们的工作流中。OpenAI 希望向好莱坞推介其 AI 视频生成工具 Sora，公司 CEO Altman 已经在奥斯卡电影节周末出席洛杉矶的多场派对。据IT之家此前报道，OpenAI Sora 模型可以严格根据用户输入的提示词，制作长达一分钟的视频，保持较高的视觉质量。该模型可以深度模拟真实物理世界，标志着人工智能在

3/23/2024 10:12:14 AM

浩渺

开发者再分享 OpenAI Sora 生成的短视频：树叶大象、彩虹瀑布等

OpenAI 今年 2 月推出 Sora 模型之后，迅速成为 AI 圈内头条，能够基于用户的一句话，生成最长 1 分钟的视频，效果接近实拍。OpenAI 目前并未向公众发布 Sora，不过开发者 @LinusEkenstam 近日发布系列推文，展示了由 Sora 生成的 9 段新视频，包括被树叶覆盖的大象、蜜蜂视角飞跃花丛，以及彩虹颜色的瀑布等等。提示词：“An elephant made of leaves running in the jungle”（树叶做的大象在丛林中奔跑）提示词：“An adorable

3/19/2024 11:52:53 AM

故渊

万字干货！Sora 如何如何转化为实际生产力？

2 月 16 日凌晨（北京时间）正月初七，在没有任何消息和预兆下，Open AI 突然发布了首个文生视频大模型——Sora，借此Sora正式对外曝光，AI视频领域也迎来了前所未有的关注度，并且在极短时间内震惊业界，并持续破圈。如今虽然距离 Sora 发布已有 1 个月的时间，但各方对 Sora 大模型的讨论仍在持续，主流业界也对 Sora 基本达成了共识。Sora 到底为什么能够震惊业界？是真的遥遥领先，还是在过度神话？以及我们如何将 Sora 落地应用于实际项目？本篇文章将带你一一了解！引言 Sora 的技术文

3/19/2024 8:41:28 AM

团队新浪MDC

OpenAI 首席技术官：不确定 Sora 的训练数据来自哪里

感谢OpenAI 近期推出了炙手可热的文本转视频生成模型 Sora，然而该公司首席技术官 (CTO) Mira Murati 在接受华尔街日报采访时却语焉不详，无法明确说明 Sora 的训练数据来源。在采访中，记者直接询问 Murati 关于 Sora 训练数据来源时，她仅以含糊的官方话术搪塞：“我们使用的是公开可用数据和许可数据。”当记者追问具体来源是否包含 YouTube 视频时，Murati 竟然表示“我实际上并不确定（I'm actually not sure about that）”，并拒绝回答有关 In

3/18/2024 4:07:57 PM

远洋

全球首个类 Sora 开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类 Sora 架构视频生成模型，来了！整个训练流程，包括数据处理、所有训练细节和模型权重，全部开放。这就是刚刚发布的 Open-Sora 1.0。它带来的实际效果如下，能生成繁华都市夜景中的车水马龙。还能用航拍视角，展现悬崖海岸边，海水拍打着岩石的画面。亦或是延时摄影下的浩瀚星空。自 Sora 发布以来，由于效果惊艳但技术细节寥寥，揭秘、复现 Sora 成为了开发社区最热议话题之一。比如 Colossal-AI 团队推出成本直降 46% 的 Sora 训练推理复现流程。短短两周时间后，该团队再次发布最

3/18/2024 2:58:56 PM

清源

从直观物理学谈到认知科学，Sora不是传统物理模拟器盖棺定论了？

本文篇幅很长，主题很多，但循序渐进，对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。最近，OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外，OpenAI 更是将 Sora 定义为一个「世界模拟器」（world simulators）。当然，这一说法遭到了包括图灵奖得主 Yann LeCun 在内很多学者的反驳。LeCun 的观点是：仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界，生成视频的过程与基于世界模型的因果预测完全不同。近日，澳大利亚麦考瑞大学

3/18/2024 11:47:00 AM

机器之心

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

采访首次揭示出 Sora「有所为（比如，将生成效果逼向极限）」和「有所为不为（比如短期内不开放、不生成公众人物）」背后的深层考量——找到一条将 AI 融入日常生活的正确道路是极其困难的，但也绝对值得一试。OpenAI 的 Sora 在今年 2 月横空出世，把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限，但是在各媒体平台上，Sora 的身影无处不在，大家都在期待着使用它。在前几天的访谈中，三位作者透露出 Sora 的更多细节，包括它处理手部时仍然存在困难，但正在优化。他们也对 S

3/15/2024 3:28:00 PM

机器之心

OpenAI 首席技术官：文生视频工具 Sora 数月内将公开发布，拟支持生成音频

《华尔街日报》当地时间 13（今）日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示，Sora 将在今年推出，“可能要等几个月”。穆拉蒂表示，除了面向公众公开提供 Sora 外，OpenAI 还计划加入音频生成功能，可能会使场景更为逼真。此外，公司还计划允许用户自己编辑 Sora 生成的内容，“因为 AI 工具并不总能生成准确的结果”。她说，公司正在试图找寻方法，使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时，穆拉蒂没有给出非常具体的答案：“我不打算详谈所使

3/13/2024 10:30:35 PM

清源

Sora 团队负责人称 Sora“还不是一个产品”，短期不会向公众开放

感谢近日，YouTube 频道 WVFRM Podcast 在其节目中，邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注：三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh，均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题，其称目前 Sora 仍处于反馈获取阶段，“还不是一个产品，短期之内不会向公众开放。”对于什么时候把它变成一个产品，我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它，但

3/13/2024 4:31:15 PM

清源

OpenAI 视频生成服务 Sora 引发隐私担忧，意大利数据监管机构展开调查

感谢意大利数据保护机构 (Garante) 周五宣布，已对微软支持的 OpenAI 公司开发的一项服务展开调查，这个名为 Sora 的服务可以根据文本提示生成视频。监管机构要求 OpenAI 澄清其向用户和非用户告知其产品 Sora 使用的数据的方式是否符合欧盟法规。OpenAI 公司暂未对此事发表评论。意大利数据监管机构是欧盟国家中最为积极的监管机构之一，一直致力于评估人工智能平台是否符合欧盟的数据隐私法规。IT之家注意到，去年该机构就以涉嫌违规使用用户数据为由，禁止了聊天机器人 ChatGPT 在意大利的使用。

3/10/2024 5:42:41 PM

远洋

资讯热榜

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快宾州州立大学推出首个人工智能工程学位，抢占教育先机 DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜 Meta 新超级智能实验室遭遇离职潮，AI 人才流失引发担忧联合国成立人工智能咨询小组「精而巧」的端侧大模型为何火了？在代理 AI 和物理 AI推动下，全球芯片市场预计将突破 1 万亿美元大关 OpenAI 将推出家长监控功能以应对青少年自杀悲剧

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体英伟达 Anthropic 论文代码训练算法 AI新词 Stable Diffusion 芯片 LLM 蛋白质开发者腾讯苹果 Claude 生成式 Agent AI for Science 神经网络 3D 机器学习研究生成 xAI 人形机器人 AI视频计算百度 Sora GPU AI设计华为工具大语言模型 RAG 搜索具身智能字节跳动大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot DeepMind 特斯拉应用