应用

优刻得为智谱AI构建千卡推理集群，助力全球用户畅享大模型智能生活

时光倒回到 2021 年的那个夜晚。一位妈妈灵感枯竭，无法继续她的小说创作；一旁的爸爸正忙碌于代码的世界，他想要在工作之余开发一款小游戏，却困于代码调试；而他们的孩子，正眉头紧锁地趴在书桌上，为一道奥数题苦思冥想。2024 年的今天，AI 大模型的出现让这一切发生改变。在「智谱清言」的助力下，妈妈的小说创作焕发新生，她只需将自己的创意和构思输入给大模型，就可以生成自然生动的故事情节和对话；爸爸用大模型进行代码编程和调试，通过分析代码逻辑，大大减少了开发的繁琐流程，减轻了一大半的⼯作量；大模型也成为了小朋友学习上的得

2/28/2024 10:05:00 AM

新闻助手

重磅发布！Stable Video 零基础使用教程及应用案例

前言上周 Stable Video 开放公测，可以生成 4s 视频，我第一时间体验了一波。相比 Sora 可生成 60s 多角度多机位多角色的视频，Stable Video 效果没有那么惊艳。但是相比市面上主流的 AI 视频 Runway、pika 等还是有一定优势的，下文中我也会进行效果对比。目前 Stable Video 对所有用户都可以免费开发，每天可领 150 积分，图生视频每使用一次消耗 10 积分，文生视频消耗 11 积分，还可以付费升级。接下来让我们一起来试一试吧。关于 Sora：一、初步体

2/28/2024 7:39:34 AM

yaoyao

自动驾驶领域，「决策」和「感知」终于握手言和

作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温，却呈现出愈发复杂而矛盾的现象。一方面，资本力量的积极投入，行业巨头纷纷抢占先机。例如，特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本，并已在美国和加拿大地区逐步面向非员工用户提供更新服务。

2/27/2024 10:59:00 AM

郭思

3000字干货！五个章节深入掌握 Stable Cascade（附模型下载）

在 2024 年 2 月 12 日，Stability.Ai 公司发布了新模型 Stable Cascade。上线了一段时间的新模型，小伙伴们体验感如何呢？这篇文章和你深度聊聊~ 往期介绍：一、前言 Stable Cascade 模型最大的优点是是能生成带有文字的图片，文字出错率相比以前模型少很多；其次是硬件要求降低，甚至与 sd1.5 相比，该架构比之前版本实现了 16 倍的成本降低；最后一大亮点是模型更加理解提示词语义。这篇文章带大家详细了解 Stable Cascade 模型。最后我整理打包了此模型，「

2/27/2024 5:40:07 AM

设计师学Ai(有课）

从 Sora 的发展史，聊聊设计师如何面对 AI 焦虑

经过春节小休整，很多朋友都鼓起信心重新出发，因为吉祥话听多了还是会受用，没想到返岗途中还没来得及跟大家道句开工大吉，资讯话题就被Sora的发布信息填满。关于这款神器的详细介绍：Sora的发布让人感叹科幻电影都不敢这样拍，而且很多权威平台都认为奥特曼的大招还没亮出来，几句话做60秒视频只是前戏，先吊吊大家胃口，为他后面融资铺垫。此图最近已经符号化了 Sora这个名字据说来自日文中的“空”（そら sora），象征“无限创造力”，众所周知，空也是佛家用语，以我的无知只能找来《道德经》的“无”来应战，无中生有，有生于无，

2/27/2024 12:40:44 AM

设计史太浓

Sora 面世，视频生成的 GPT-3 时刻来了

2月16日凌晨，正值中国春节法定节假日期间，OpenAI 毫无预兆地发布了 AI 视频生成大模型 Sora。看过视频效果后，网友纷纷感叹「现实，不存在了。」不夸张地说，Sora 的技术结果直接碾压了过去世界范围内所有文生视频的探索结果，颠覆了 AI 短视频生成的现状。

2/26/2024 7:05:00 PM

林军

新模型 Stable Diffusion 3 与 Stable Cascade 全面解析

大家好，我是花生~ 最近 Stability AI 又接连推出了 2 个新的模型：Stable Diffusion 3 和 Stable Cascade，在图像生成效率和质量上比半年前推出的 SDXL 1.0 有了明显提升，今天就为大家介绍一下 2 款新模型的特点和用法。：一、Stable Diffusion 3 简介官方介绍：加入等候名单： 2 月 22 号，Stability AI 发布了新模型 Stable Diffusion 3（下面简称为 SD 3.0），这也是 Stable Diffusion

2/26/2024 8:13:29 AM

夏花生

7000字干货！Sora 提示词秘籍和竞品效果对比

2024 年 2 月 16 日凌晨，OpenAI 正式发布了文本到视频生成模型 Sora，直接生成 60s 视频，多角色多镜头切换的视频，还上了央视新闻。目前 Sora 并未开放，只向少数导演艺术家开放邀请码。至此，好莱坞的时代结束了，人人可以做视频电影的时代到来啦！今天我们就 Sora 生成视频来拆解提示词秘籍公式，竞品视频生成效果对比，解析 Sora 优势劣势和 Sora 模型原理。一、AIGC 视频模型效果对比首先让我们看看，目前主流的 AI 视频工具 Runway、Pika、Stable Video

2/26/2024 7:38:08 AM

yaoyao

幼儿园学历都能看懂！ Sora 技术原理科普

本文来源于公众号赛博禅心，作者金色传说大聪明写在前面本文的阅读门槛很高，需要至少幼儿园毕业本文讲述 Sora 的 Spacetime Patches 技术，此处意义为时空碎片图片主要来自《哆啦 A 梦：二次元口袋照相机》 OpenAI 好棒，哆啦 A 梦好棒，我好棒！大雄慵懒地躺在房间的地毯上，眼神迷离地看着天花板上的光斑。他翻来覆去地玩着手中的老旧玩具小兵，回想着上个暑假和小伙伴们的那场刺激的野营冒险。大雄：“哆啦 A 梦，那次野营真的很好玩，但我现在只能记得一点点。要是能有办法随时重温那种感觉就好了。”

2/26/2024 1:29:58 AM

谷歌Gemini生图功能紧急关闭，口碑一夜塌房，Yann LeCun：我早就知道

Gemini 好像终于被玩坏了。去年年底，谷歌 Gemini 震撼了业界，它是谷歌「最大、最有能力和最通用」的 AI 系统，号称第一个原生多模态大模型，能力超越 GPT-4，也被认为是谷歌反击微软和 OpenAI 的强大工具。对此，在 2 月 8 日，谷歌还把自家对标 ChatGPT 的服务 Bard 更名为 Gemini，以着重体现新使命 —— 旨在提供对「最强模型系列」的访问。上周谷歌还火速更新了 Gemini Pro 1.5 版。结果，推出不到一个月，这个 Gemini 就翻车了。多离谱呢，作为一个多模态的生

2/25/2024 7:49:00 PM

机器之心

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。为什么 Sora 坚持使用 Diffusion Transformer，其中的原因从同时期发表在 ICLR 2024（VDT: General-purpose Video Diffusion Transformers via Mask Modeling）的论文可以窥见一二。这项工作由

2/25/2024 7:36:00 PM

机器之心

推出不到一个月，谷歌Gemini翻车了

机器之能报道编辑：Sia谷歌下架 Gemini 人物图像生成服务。三月前，谷歌 Gemini 轰轰烈烈亮相，被描述为谷歌“最大、最有能力和最通用”的 AI 系统，并补充说它具有复杂的推理和编码能力。2 月 8 日，谷歌聊天机器人 Bard 正式更名为 Gemini，以反映新聊天机器人的“使命”——提供对“最有能力的模型系列”的访问。结果，推出不到一个月，Gemini 就捅了个大篓子。用户使用人像生成服务时发现，让 Gemini 承认白人的存好像非常困难，AI 拒绝在图像中描绘白人，以至于生成不少违背基本事实（性别、

2/23/2024 6:20:00 PM

机器之能

OpenAI工程师必备经典《苦涩的教训》，原来20多年前就有了原型

大量数据学习涌现出来的能力，终于超越了人们的想象。OpenAI 推出视频生成模型 Sora 已经一周的时间了，热度不减，作者团队还在持续放出让人眼前一亮的视频。比如「一群爱冒险的小狗探索天空废墟的电影预告片」，Sora 一次生成并自己完成剪辑。当然，一个个生动、逼真的 AI 视频让人们好奇为什么是 OpenAI 率先打造出了 Sora 并能够跑通所有 AGI 技术栈呢？这一问题在社交媒体上引发了热烈的讨论。其中，在一篇知乎文章中，加州大学伯克利分校计算机科学博士、作者 @SIY.Z 分析了 OpenAI 成功的一些

2/23/2024 11:06:00 AM

机器之心

Sora全球爆火，对设计师来说是机会还是挑战？

想必最近大家在网上都看到了有关 Sora 的信息，这是 OpenAI 在春节期间发布的一项令人难以置信的新技术，在人工智能领域，这可以说是颠覆性的突破和创新。简单来说，它是一个视频生成器，你给它一段文字，它就能帮你创造出你想要的视频作品！我们先来看一个 Sora 生成的视频。这个视频的咒语（Prompt）：一位时尚的女士穿着黑色皮夹克、长红裙和黑色靴子，手拿黑色手袋，在东京一条灯光温暖、霓虹灯闪烁、带有动感城市标志的街道上自信而随意地行走。她戴着太阳镜，涂着红色口红。街道潮湿而有反光效果，色彩缤纷的灯光仿佛在地面

2/23/2024 6:56:02 AM

团队58UXD

AI 视频新王者诞生！一文盘点 Sora 模型 14 项功能特点！

大家好，我是花生~ 2 月 16 日 OpenAI 发布了一个新的 AI 视频生成模型 Sora，它可以根据文本生成 60s 的高质量视频，完全突破了之前 AI 文生视频存在的各种局限，所以一出现就引起广泛关注和热烈讨论，大家应该对它都有所了解。今天就根据网上已公布的视频，对 Sora 的功能特性进行一个盘点总结，其中包含与 Runway、Pika 等 AI 视频工具的生成效果对比，让大家对 Sora 的能力有一个更直观全面的了解。相关推荐：一、60s 超长视频之前优设已经推荐过 AI 视频工具，比如 Runw

2/22/2024 8:51:19 AM

夏花生

超多实战案例！大厂出品的AIGC设计实践手册

一、前言随着技术的不断迭代，AIGC 能力的可控性得到了进一步提升，可应用的场景也越来越多，在文本、图像、视频等多个领域都有了广泛应用。用户已经可以用自然语言来与 AI 工具进行交互，革新传统办公方式，工作任务可以更具创造性，并且提高了生产效率。本文将从 AIGC 体系化应用角度聊一聊，设计团队如何利用 AIGC 来优化工作流，提升效率的同时，更多推动 AIGC 能力应用与落地。二、AIGC 对设计的影响如何更好的利用 AI 工具帮助我们提升设计效率与价值，我们尝试了从产品设计类需求、运营设计类需求、视频/动

2/22/2024 6:48:10 AM

团队WOWDesign

Sora为何出自OpenAI？一线员工作息时间线揭秘：我们疯狂地卷

数数每天几个小时？为什么是 OpenAI 率先打造出了 Sora？现在全世界不论研究员、工程师还是投资人都在问这个问题。最近几天，人们对于视频大模型 Sora 的讨论热度持续升高，信息早已破了圈，相关的投资热点都已经出现了两轮。 Sora 生成的「Flower tiger」视频。试问这种生成能力会催生多少新脑洞？在一篇文章中，加州大学伯克利分校计算机科学博士、知乎作者 @SIY.Z 分析了 OpenAI 成功的一些原因，包括：目标和商业模式明确：目标就是

2/21/2024 3:00:00 PM

机器之心

出圈的Sora带火DiT，连登GitHub热榜，已进化出新版本SiT

好的研究不会被埋没，只会历久弥新。虽然已经发布近一周时间，OpenAI 视频生成大模型 Sora 的影响仍在继续！其中，Sora 研发负责人之一 Bill Peebles 与纽约大学助理教授谢赛宁撰写的 DiT（扩散 Transformer）论文《Scalable Diffusion Models with Transformers》被认为是此次 Sora 背后的重要技术基础之一。该论文被 ICCV 2023 接收。论文地址：地址：，DiT 论文和 GitHub 项目的热度水涨船高，重新收获大量关注。论文出现在

2/21/2024 2:54:00 PM

机器之心

资讯热榜

AI视频资讯早读！7个产品更新+8个案例精选 DeepSeek-Prover-V2-671B 模型开源，数学推理领域迎来新突破性能与效率的双赢:Qwen3横空出世，MoE架构大幅降低部署成本 GPT-4o图像生成功能现已集成至自定义GPTs 大模型应用系列：两万字解读MCP 全球首部AI制作长片《海上女王郑一嫂》震撼上映：科技与艺术的碰撞李飞飞/DeepSeek前员工领衔，复现R1强化学习框架，训练Agent在行动中深度思考李彦宏发布文心大模型双星:X1Turbo 直指 DeepSeek，4.5Turbo 超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta 图像 AI创作技术论文 Gemini Stable Diffusion 马斯克算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI Claude 模态字节跳动大语言模型搜索驾驶具身智能神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型亚马逊科技智能体 AGI DeepMind