AIGC宇宙 AIGC宇宙

理论

李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考

什么开源算法自称为DeepSeek-R1(-Zero) 框架的第一个复现? 新强化学习框架RAGEN,作者包括DeepSeek前员工Zihan Wang、斯坦福李飞飞团队等,可训练Agent在行动中深度思考。 图片论文一作Zihan Wang在DeepSeek期间参与了Deepseek-v2和Expert Specialized Fine-Tuning等工作,目前在美国西北大学读博。
4/25/2025 1:34:53 PM

刚刚,OpenAI推出「轻量级」Deep Research,免费用户也能薅羊毛!

刚刚,OpenAI 宣布推出「轻量级」版本的 Deep Research,免费用户也可以使用! 轻量级版本由 OpenAI 的 o4-mini 模型提供支持,而之前的 Deep Research 使用的是更强大的 o3 模型(或其变体)。 OpenAI 表示,虽然响应通常会更简短,但仍能够维持您所期待的深度和质量。
4/25/2025 10:26:19 AM
机器之心

突发!OpenAI免费开放Deep research,超强AI Agent

今天凌晨4点30,OpenAI推出轻量级版本的Deep research功能提高当前的速率限制,以扩大Plus、Team和Pro用户的使用范围。 值得一提的是,从今天开始免费ChatGPT用户可以使用Deep research,并且支持最新的o4-mini模型。 下面「AIGC开放社区」就用免费版为大家展示一下Deep research的免费功能。
4/25/2025 9:09:00 AM
AIGC开放社区

机械臂+大模型+多模态:打造人机协作具身智能体

在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
4/25/2025 2:30:00 AM
贝塔街的万事屋

DeepSeek在数据领域的30个应用场景

在这个数据AI的时代,DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。  本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景,带大家一窥AI如何重塑数据价值链。 一、数据获取与处理篇1.
4/25/2025 12:50:00 AM
大数据AI智能圈

揭秘大模型的魔法:训练你的tokenizer

大家好,我是写代码的中年人。 在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代,“Tokenizer(分词器)”这个词频频出现在开发者和研究者的视野中。 它是连接自然语言与神经网络之间的一座桥梁,是大模型运行逻辑中至关重要的一环。
4/25/2025 12:20:00 AM
写代码的中年人

Windsurf全面降价!编程赛道的价格战要来了;被OpenAI收购尚未证实

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)刚刚得到消息,AI编码助手初创公司 Windsurf周一宣布“全面”降价,称随着与竞争对手 Cursor 的竞争加剧,用户可以“大幅节省成本”。 Windsurf 表示,它将放弃其复杂的“流程操作积分”系统,该系统会向开发者收取其 AI 在后台执行的操作的费用。 此外,该公司还将team plans的价格从每位用户每月 35 美元降至 30 美元,同时其企业计划的价格也将“大幅降低”。
4/24/2025 6:40:17 PM
云昭

谷歌“Wi-Fi密码”式的最瘦大模型

Gemma 3 的“低门槛 AI”计划露面了,谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码,其实却是谷歌迄今为止最精简的大模型是的,不再只属于高端服务器和土豪显卡,普通玩家的游戏卡,甚至手机,都能一试身手。 这波操作的核心是三个字:量化训练(Quantization-Aware Training, QAT)。
4/24/2025 2:13:00 PM
文摘菌

大模型向量去重的N种解决方案!

简单来说,“向量”Vector 是大模型(LLM)在搜索时使用的一种“技术手段”,通过向量比对,大模型能找出问题的相关答案,并且进行智能回答。 向量简介Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。 “定义:向量是用于表示具有大小和方向的量。
4/24/2025 11:09:13 AM
磊哥

刚刚,OpenAI最强图像生成API上线,一张图1毛5!

昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。 这一次,他们直接把每张图的成本打到几美分。 图片对于低、中、高质量的方形图像,生成大约花费0.02美元、0.07美元、0.19美元。
4/24/2025 10:31:54 AM

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。 就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。 这也意味着,从今天开始,全世界的开发人员都可以使用 ChatGPT 强大的图像生成功能了。
4/24/2025 9:38:56 AM
机器之心

大模型数据味蕾论

AI大模型就像一位厨师,预训练数据就是这位厨师的味蕾。  没有经过训练的味蕾,再好的食材也无法变成美味佳肴。 没有优质的预训练数据,再强大的计算资源也打造不出卓越大模型。
4/24/2025 9:26:13 AM
大数据AI智能圈

礼貌寒暄推高AI问答成本!OpenAI每年为此多花数千万美元?

近日,美国科技公司OpenAI的首席执行官萨姆·奥尔特曼在社交平台上透露了一个令人意外的现象:用户在与ChatGPT互动时频繁使用“请”“谢谢”等礼貌用语,这一行为竟然导致公司每年需额外承担数千万美元的运营成本。 这一消息引发了广泛讨论,人们不禁好奇,为何简单的礼貌寒暄会带来如此高昂的成本? 礼貌寒暄背后的成本根据《今日美国》及美国《石英》杂志的报道,当用户在ChatGPT的用户界面说“谢谢”时,大模型会按照算法回复“不客气”。
4/24/2025 9:11:09 AM
小菲

从入门到精通:如何在React中构建人工智能驱动的梗图生成器

译者 | 李睿审校 | 重楼为什么要构建人工智能梗图生成器? 梗图(Meme)堪称互联网时代的“全民语言”。 无论是想调侃朋友,还是想表达编程让人崩溃的无奈,梗图总能精准地表达其意境。
4/24/2025 8:39:17 AM
李睿

OpenAI 新模型 GPT-4.1 可靠性遭质疑:独立测试显示其对齐性下降

IT之家 4 月 24 日消息,本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并声称该模型在遵循指令方面表现出色。 然而,多项独立测试的结果却显示,与 OpenAI 以往发布的模型相比,GPT-4.1 的对齐性(即可靠性)似乎有所下降。 据IT之家了解,通常情况下,OpenAI 在推出新模型时,会发布一份详细的技术报告,其中包含第一方和第三方的安全评估结果。
4/24/2025 8:29:59 AM
远洋

你的数据有多好,你的模型就有多强

在AI大战烽火连天的今天,所有人都在追逐参数规模的增长和架构的优化。 然而,行业内的一个秘密正在悄然成形:拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。 数据,而非算法,正成为区分强弱的决定性要素。
4/24/2025 12:40:00 AM
大数据AI智能圈

微软发布全球首个1-bit大模型:内存缩至0.4 GB,参数只有0和±1,性能追平全精度

微软的BitNet b1.58 2B4T 的技术报告悄然上线。 其实在开源社区里,关于极致低比特量化的大模型早就有各种传闻,这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。
4/23/2025 12:11:40 PM
文摘菌

突发!OpenAI或将收购谷歌浏览器Chrome

今天凌晨4点,路透社消息,OpenAI一位高管在谷歌垄断案庭审中作证,将收购其浏览器Chrome。 目前,谷歌在美国正遭遇反垄断审判,如果上诉失败不仅Chrome会被拆分,其数字广告业务也会被剥离,会对谷歌进行大重组。 今天凌晨1点左右,华盛顿邮报最早报道了谷歌被起诉的消息。
4/23/2025 11:52:05 AM
AIGC开放社区