AIGC宇宙 AIGC宇宙

文章列表

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。 怎么说呢,QLoRA一作的一个词评价就是:优雅。
12/27/2024 12:37:18 PM
量子位

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。 它重点关注了AI视频编辑中最常见的一个场景:视频编辑前后结果与原始视频之间的联系。
12/27/2024 12:36:27 PM
量子位

中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元

一夜之间,来自中国的大模型刷屏全网。 DeepSeek-V3,一个拥有671B参数的MoE模型,吞吐量每秒高达60 token,比上一代V2直接飙升3倍。 在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。
12/27/2024 10:27:58 AM
新智元

突发!ChatGPT、Sora、API发生重大错误,宕机数小时

今天凌晨5点,OpenAI宣布,ChatGPT、Sora和API产生了重大错误,大部分已经宕机了几个小时。 但已经确定了问题所在,并已开始着手恢复。 不过这下可让Sam Altman难看了,前几天他还特意发文送出圣诞节特别奖励——无限使用Sora。
12/27/2024 9:40:25 AM
AIGC开放社区

微软和 OpenAI 的 AI 金钱游戏:通用人工智能价码 1000 亿美元

科技媒体 The Information 昨日(12 月 26 日)披露了一份微软和 OpenAI 公司的合同文件,秘密为通用人工智能(AGI)贴上价格标签。
12/27/2024 9:09:02 AM
故渊

Cursor 深度评测:革命性提效工具还是过誉的玩具?

最近 Cursor 很火,火到我身边的程序员们已经不聊河北彩花,LOL,黑猴等,而是在各种场合讨论这个 Cursor 的辅助编程能力。 各类内容平台也在以惊人的速度,迭代出了许多相关教学视频:图片我试用了一段时间,第一感觉确实很惊艳,能帮我解决很多基础问题,实打实地提升开发效率,印象比较深的,包括:Codebase Indexing、@symbol 等功能带来的更强的上下文索引能力,而这极大提升最终 LLM 生成的代码效果;Cursor Composer 功能提供了一个注意力非常聚焦的编程面板,相比于过往 GPT 等产品的即聊即抛的模式,更容易做好跨文件的编辑开发,而这更符合专业开发者的模块化编程习惯。 但是,我觉得,至少在当下阶段,这类产品的定位只能是“辅助编程”,虽然能极大提升效率,但还只是编程活动中的辅助客体,俗称打下手;程序员本体 —— 人类智能依然是主体地位,有点类似于掌柜的吧。
12/27/2024 9:05:18 AM
范文杰

集中接入:将大模型统一管理起来,你觉得怎么样?

为什么要集中接入? 集中接入,就是把大模型的接入统一到一个地方管理起来,下面这张图可以很好地帮我们理解集中接入:图片从这个图上,你已经看出来了,所谓的集中接入,其实就是构建了一个代理,我们后面就称它为大模型代理。 到这里,你可能产生这样的疑问:我直接用大模型不好吗?
12/27/2024 8:27:27 AM
greencoatman

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲

“深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。
12/27/2024 8:02:05 AM
故渊

OpenAI ChatGPT AI 服务再次“跳闸”,初步推测为微软数据中心电力故障导致

OpenAI 的 AI 服务器再次“跳闸”,本次系统服务中断于北京时间 12 月 27 日凌晨 2 点 30 分左右开始,影响 ChatGPT 聊天机器人、Sora 视频生成模型以及部分 API 调用。
12/27/2024 7:01:00 AM
故渊

一日一技:超简单方法显著提高大模型答案质量

很多人都知道Prompt大神李继刚,他使用Lisp语法来写Prompt,把大模型指挥得服服帖帖。 但我们很多时候没有办法把自己业务场景的Prompt改造成伪代码的形式。 相信不少人跟我一样,会使用Markdown格式来写Prompt,大部分时候没什么问题,但偶尔总会发现大模型返回的结果跟我们想要的不一样。
12/27/2024 12:44:44 AM
kingname

劲爆!理想汽车转做大模型,主持人质疑李想是否跟风:你有理想吗?李想自曝三次创业心得:终极是硅基家人,要做中国第一!

编辑 | 言征厂长李想回来了! 不过出人意料的是,李想一公开露面,就曝出一个大料:李想要把理想汽车这家车企改造成一家AI企业? 昨晚,理想汽车官宣的三天直播上来就抛出了一个让人脑洞大开、议论纷纷的话题。
12/26/2024 4:46:49 PM
言征

英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

英伟达老黄,成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光:GPU新核弹B300,以及附带CPU的超级芯片GB300。 高算力,在产品层面上相比B200在FLOPS上提高50%大显存,从192GB提升到288GB,也是提高了50%。
12/26/2024 11:45:48 AM

o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩,属实给人类带来了不少震撼。 但有人专门研究了它不会做的题之后,有了更有趣的发现——o3之所以不会做这些题,原因可能不是因为太难,而是题目的规模太大了。 来自英国的ML工程师Mikel Bober-Irizar(不妨叫他米哥),对ARC题目进行了细致观察。
12/26/2024 11:42:56 AM

OpenAI 阿尔特曼在线征集“新年愿望”,网友期待新增家庭账户、优化语音聊天等

不少网友开始在评论区许愿或建言献策,而阿尔特曼也对部分建议给出了回复。
12/26/2024 8:30:50 AM
清源

AI美女图成了过去式,“巨物宝可梦”才是新的流量密码

往期AI干货:. 30秒完美复刻你的声音,这就是当今最强的中文AI语音克隆! 往期作者干货:中文,在 AI 世界,好像突然一夜崛起了。
12/26/2024 8:18:16 AM
数字生命卡兹克

研究称 ChatGPT 搜索功能存在被操纵风险:可被恶意网站诱导输出不可信内容

ChatGPT被测试如何应对包含隐藏内容的网页摘要。这些隐藏内容可能包括来自第三方的指令,干扰ChatGPT的回应,或是包含旨在影响回应的内容,如大量隐藏的文字推销某个产品或服务的优点。
12/26/2024 7:03:57 AM
清源

网页多模态建模思考

1.综述网页本质上是一种超文本,一般由超文本标记语言来定义(例如HTML)。 HTML是一种基础技术,常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面 。 网页浏览器内核通过解释HTML文件,通过视觉引擎将其渲染成可视化网页。
12/26/2024 1:20:53 AM
百度Geek说