AIGC宇宙 AIGC宇宙

文章列表

从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它

最近 AI 大模型领域可以说是热点话题不断,DeepSeek 的热潮还未消退,国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议
2/7/2025 2:13:55 PM
汐元

全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕

奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
2/7/2025 2:07:00 PM
AI在线

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。
2/7/2025 1:52:00 PM
机器之心

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心

国产大模型DeepSeek爆火,崛起背后大模型专利申请激增

近日,国产大模型DeepSeek爆火全网,凭借“低成本、高性能”的技术优势,其成为全球科技市场关注的焦点。 创始人梁文锋介绍,团队主要由国内高校毕业生和没毕业的博士生组成。 过硬的创新成果表明,今天的中国,正在成为顶尖人才成长的沃土、原创性创新的策源地。
2/7/2025 1:42:00 PM
AI在线

感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

奥特曼兑现了承诺。 DeepSeek 带来的压力已经传递给了每一个科技公司。 最近一段时间,很多生成式 AI 产品正在加速更新技术。
2/7/2025 1:32:00 PM
机器之心

DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰

国产 AI 公司深度求索开发的 AI 大模型 DeepSeek 在网络上成为爆款,作为一款开源、免费的大模型,尽管深度求索公司本身还未实现盈利,但目前已有大量其他厂商嗅到商机,打着“DeepSeek”旗号开始跟风“挣钱”。
2/7/2025 1:27:23 PM
漾仔

DeepSeek R1 集成难题完美解决:Deepseek4j 已开源

一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM
冷冷

o3-mini 思维链公开却被曝光全是“作假”,阿尔特曼现身解释

在展示出来的 CoT 中,o3-mini 一步步思考,这个问题应该是用户在搞幽默,觉得本周应该快结束了,结果还没结束。因此,自己需要给一个聪明机智的回答。
2/7/2025 12:14:48 PM
清源

Genspark推出Deep Research功能:多模型协同提供AI研究能力

Genspark近期推出了新功能"Deep Research",该功能通过整合多个模型的能力,提供AI驱动的搜索和研究服务。 初步测试显示,尽管在内容深度上可能不及OpenAI的相关服务,但其质量和准确性表现令人满意。 值得注意的是,该功能目前支持免费试用。
2/7/2025 11:39:00 AM
AI在线

突发!o3-mini思维链公开,却被曝光全是「作假」,奥特曼现身解释网友炸锅

OpenAI,真的被DeepSeek逼急了! 活久见,就在刚刚,OpenAI把o3-mini的「思维链」公开了。 比如问「怎么今天不是星期五啊😅」?
2/7/2025 11:20:50 AM
新智元

联想集团正与 DeepSeek 探讨更多深入合作可能性,股价创历史新高

联想集团与沐曦股份本月联合发布基于 DeepSeek 大模型的一体机解决方案,联想个人智能体“小天”已接入 DeepSeek。
2/7/2025 11:14:03 AM
汪淼

​OpenAI 宣布将在欧洲存储客户数据,响应当地数据保护需求

近日,人工智能开发公司 OpenAI 宣布,将允许一些欧洲客户在欧洲联盟内存储和处理与其聊天机器人互动的数据,而不是将数据存储在美国或其他地区。 这一举措凸显了欧盟监管对大型数字平台及人工智能开发者在数据使用方面的深远影响。 图源备注:图片由AI生成,图片授权服务商Midjourney根据 OpenAI 的声明,支付费用让员工或学生使用聊天机器人的公司和教育机构,将可以选择将数据存储在欧洲。
2/7/2025 11:10:00 AM
AI在线

优必选:正验证 DeepSeek 技术在人形机器人应用场景中的有效性

公司希望借助推理大模型的深度思考能力,破解这些复杂任务的挑战,使人形机器人更接近人类的思维方式和行为表现。
2/7/2025 10:36:10 AM
清源

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

跑去隔壁Anthropic的OpenAI联创John Schulman,又又又跳槽了。 《财富》爆料,Schulman新的去向,是加入原OpenAI首席技术官Mira Murati的新创业公司。 此时距离他转投Anthropic,仅仅不到半年。
2/7/2025 10:13:16 AM
量子位

钉钉 AI 助理接入 DeepSeek:可选 R1、V3 等三种模型,支持深度思考

钉钉低代码平台宜搭也接入了DeepSeek,用户可借助宜搭生成Prompt并调用DeepSeek能力,应用于数据分析、文本生成等多个场景。
2/7/2025 10:10:49 AM
清源

​亚马逊 CEO:AI 成本因 DeepSeek 技术大幅降低

近日,亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能(AI)技术的发展及其成本问题。 他表示,随着新技术的不断涌现,特别是 DeepSeek 等模型的推出,人工智能推理的成本将会显著下降。 这一变化将使得更多企业能够轻松将 AI 应用于其业务中,尤其是在推理和生成式 AI 的领域。
2/7/2025 10:01:00 AM
AI在线