理论
无需联网!DeepSeek-R1+本地化RAG,打造私有智能文档助手
1、写在前面官方开源的版本除了满血的 671b 外,还有 1.5b,7b,8b,14b,32b,70b 六个蒸馏后的尺寸,笔者使用 Ollama 在电脑本地部署了 7b 的模型,在终端中测试了虽然回答没有满血版的那么惊艳,但凑活能用。 作为一款高阶模型开源,确实要 salute 一下。 不过进一步的问题是,我们面对这样的强思维链模型,除了在官网间或 Chat 一下,如何进一步的将其变成工作或生活场景的生产力工具?
2/21/2025 3:56:42 PM
韦东东
刚刚,DeepSeek官宣:下周将是重磅开源周!网友:真正的OpenAI来了!
DeepSeek在X上发布推文,为即将到来的开源周预热。 下周起,DeepSeek将连续开源5个代码库! DeepSeek的通知翻译如下:我们是一个小团队@deepseek_ai ,正在探索 AGI。
2/21/2025 3:18:20 PM
抛弃OpenAI后,Figure AI发布新一代人形机器人Helix模型
当地时间2月20日,机器人初创公司Figure AI宣布发布其最新成果——Helix模型。 这是一款用于通用人形机器人控制的视觉-语言-动作(VLA)模型,标志着人形机器人技术的重大突破。 Helix模型的关键技术突破.
2/21/2025 2:53:40 PM
DeepSeek开源模型重塑法证审计,个人本地做RAG+微调,25年多试试
全球82亿人口,网民55.6亿,而ChatGPT坐拥3.5亿全球月活,渗透率算下来也有6%左右了。 但这还是DeepSeek-R1开源之前的故事。 1/20 开源以来,DeepSeek-R1属实又硬拉高了一大波全球 AI的渗透率,或者换句话说,是解锁了更多的应用场景。
2/21/2025 2:37:21 PM
韦东东
用户破4亿、企业客户翻倍!OpenAI的GPT-5将推进全球AI战争进入白热化阶段!
用户突破4亿、企业客户翻倍、GPT-5即将上线——OpenAI用数据与野心宣告:全球AI战争进入白热化阶段!据首席运营官布拉德·莱特卡普周四在X平台上的帖子称,OpenAI的ChatGPT周活跃用户已突破4亿大关,这一里程碑彰显了该公司在消费者和企业市场日益扩大的影响力。 在OpenAI面临来自埃隆·马斯克的xAI和DeepSeek等竞争对手日益加剧的竞争之际,ChatGPT实现了快速扩张。 这两家公司最近都推出了旨在打破OpenAI主导地位的高性能模型。
2/21/2025 2:23:17 PM
Michael Nuñez
“万模裸奔”,DeepSeek正颠覆网络安全行业游戏规则
对于企业而言,AI既是提升生产力的强大工具,同时也为攻击者和恶意内部人员提供了“大杀器”。 随着生成式AI(例如ChatGPT和DeepSeek)在企业和政府机构中的广泛应用和不安全部署,“万模裸奔”产生的数据安全风险已经到了失控的边缘。 2025年是AI安全元年,首席信息安全官(CISO)们必须提前做好准备,应对“万模裸奔”引发的数据安全危机。
2/21/2025 11:23:59 AM
佚名
OpenAI百万美元豪测:顶级大模型取代不了程序员
当Sam Altman宣称大模型将取代"低阶程序员"时,OpenAI自家的最新研究却给出了相反的答案。 该研究联合百名工程师开展SWE-Lancer基准测试,结果显示:面对价值百万美元的真实软件开发任务,三大顶尖大模型的总收入竟不足21%,最强者Claude 3.5也仅解决26%技术问题。 这场AI与人类程序员的"抢饭碗"对决,暂时以机器的惨败告终。
2/21/2025 11:08:46 AM
佚名
两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。 最近,各个行业又掀起了接入 DeepSeek 的狂潮,大家唯恐落后于人。 北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读,也是此前 o1 解读(北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式)的续作。
2/21/2025 10:34:49 AM
机器之心
OpenAI周活跃用户突破4亿,高管称DeepSeek竞争并未影响产品路线图
尽管市场竞争愈发激烈,OpenAI的用户数量仍在持续攀升。 据OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)透露,截至今年2月,OpenAI的周活跃用户数已达到4亿,相较于2024年12月的3亿增长了33%。 这一数据此前并未对外公开。
2/21/2025 10:26:56 AM
佚名
人形机器人可能引发高风险全球对决
DeepSeek的R1出现震撼了市场,从美国股市抹去了超过1万亿美元,并在科技界引发了冲击波。 它让人工智能公司争先恐后地重新评估他们的战略,并对这些进步做出回应。 此次发布还突显出,美国和中国之间的人工智能竞赛比许多人预期的要激烈。
2/21/2025 10:14:59 AM
AI情报室
想要提升 DeepSeek 回复质量,会这一招就够了(90%的人不知道)
今天继续介绍deepseek核心技术:反事实推理。 上一篇简要回顾:反事实推理,是一种通过构建与事实相反的假设性情景,探索因果关系和潜在结果的逻辑推理方法;反事实推理,有着严密的数学模型,属于因果推断第三层次:关联,干预,反事实;反事实推理,能帮deepseek突破数据量上限,加强结果解释性,提升回复丰富度;画外音:详见《deepseek凭啥能给出这么丰富的答案 - 反事实推理(上)》。 反事实推理,对我们写提示词,获取更佳的回答质量有什么启示呢?
2/21/2025 9:30:00 AM
58沈剑
抛弃OpenAI,Figure亮王牌:史上首次两个机器人「共脑」,网友直呼太恐怖!
与OpenAI分手之后,Figure自研首个模型终于交卷了! 不用ChatGPT,Figure直接把视觉-语言-动作模型(VLA)——Helix装入人形机器人大脑。 它可以让机器人感知、语言理解、学习控制,是一个端到端的通用模型。
2/21/2025 9:06:28 AM
新智元
如何使用Java设计一套多智能体系统
译者 | 核子可乐审校 | 重楼2025年将成为AI智能体之年。 在本文的场景中,AI智能体是一套能够利用AI通过一系列步骤实现目标的系统,且具备就结果进行推理及更正的能力。 在实践中,智能体遵循的步骤可总结成图表形式。
2/21/2025 8:17:13 AM
核子可乐
断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物
与OpenAI断交之后,Figure首个成果出炉:Helix,一个端到端通用控制模型,它能让机器人像人一样感知、理解和行动。 只需自然语言提示,机器人就能拿起任何东西,哪怕是从没见过的东西,比如这个活泼的小仙人掌。 从官方放出的演示中可以看到,它在接收到人类的提示后,就会按照指令逐一拿起桌上的物品放进冰箱。
2/21/2025 6:05:54 AM
DeepSeek R1范式复现笔记
作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程
DeepSeek创始人是谁?这个问题DeepSeek也整不会了!
梁文锋到底有多低调? 你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。 事情是这样的。
2/20/2025 2:54:56 PM
DeepSeek相关人士已辟谣:融资消息均为谣言 阿里股价微跌0.88%
出品 | 51CTO技术栈(微信号:blog51cto)针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息,DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。 (图1)但作为另一主角的阿里,尚无回应。 腾讯科技报道,阿里美股股价微跌0.88%。
2/20/2025 2:30:31 PM
简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理
仅需简单提示,满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。 上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度,大幅提升上下文学习性能,突破少样本学习上限。 图片大语言模型使用多步推理解决复杂数学问题,即先将复杂问题分解为多个步骤并逐步进行推理。
2/20/2025 12:09:22 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用