文章列表

分类

标签

1/30 训练步骤复刻 DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型 RL 训练方法

现在，开源 RL 训练方法只需要用 1/30 的训练步骤就能赶上相同尺寸的 DeepSeek-R1-Zero 蒸馏 Qwen。

2/22/2025 5:48:21 PM

清源

小米超级小爱重新上线 DeepSeek R1，默认使用联网搜索

据IT之家网友反馈，小米超级小爱现已重新上线 DeepSeek R1 模型，默认使用联网搜索，输入打开深度思考即可开启。

2/22/2025 5:46:50 PM

浩渺

京东云 DeepSeek 一体机升级，单台即可运行满血版 V3 / R1 模型

京东云昨日宣布 DeepSeek 一体机再升级，京东云 vGPU 智算一体机单台即可运行满血版 DeepSeek V3 / R1。

2/22/2025 4:57:31 PM

浩渺

无问芯穹领航铸造模速空间算力生态平台，以充沛算力助造全球最大人工智能孵化器

2月21日，2025年全球开发者先锋大会（2025 GDC）模速空间专场发布会现场，在上海市徐汇区指导下，徐汇区委常委、副区长俞林伟，上海市经济信息化委基础设施管理处处长祁超出席见证，上海大模型生态发展有限公司董事长杨晶晶，上海无问芯穹智能科技有限公司总经理曾书霖，上海智能算力科技有限公司商务生态中心总监陈雪晖共同发布了由模速空间、无问芯穹和上海仪电牵头推出的国内首个“算力生态超市”——模速空间算力生态平台。 2025年，模速空间在徐汇区指导下升级“全球最大人工智能孵化器品牌”新定位，模速空间算力生态平台希望为入驻模速空间的人工智能企业提供“全周期、全要素、全流程”一站式服务，打造“算力语料算法场景”闭环，以强大算力引擎助力构建全球最大人工智能孵化器繁荣生态。模速空间算力生态平台发布仪式由无问芯穹和模速空间、上海仪电联手打造的模速空间算力生态平台将成为一个高效、便捷、安全的算力生态枢纽，为徐汇区乃至上海市的算力资源市场化运营提供最佳实践模板。

2/21/2025 7:47:00 PM

新闻助手

阶跃星辰举办生态开放日，智能终端 Agent 成最大亮点！

2月21日，阶跃星辰在上海成功举办首届Step UP生态开放日，携手来自各行各业的重量级合作伙伴，集中展示了大模型技术赋能下的丰富应用场景与创新体验。阶跃星辰首先重点阐释了在智能终端Agent领域的布局，并宣布与吉利汽车集团、OPPO、智元机器人等企业深化合作关系。同时，还展示了在金融财经、内容创作、新零售、数字人等领域丰富的创新和应用。

2/21/2025 7:32:00 PM

新闻助手

英伟达 CEO 黄仁勋首次公开回应 DeepSeek：投资者误解，AI 发展仍需强大算力

在周四的一场线上活动中，英伟达公司首席执行官黄仁勋（Jensen Huang）表示，投资者对 DeepSeek 在人工智能领域取得的进展存在误解，这导致了市场对英伟达股票的错误反应。

2/21/2025 7:30:07 PM

远洋

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。 Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。

2/21/2025 6:03:00 PM

AI在线

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。 “Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。

2/21/2025 5:37:00 PM

AI在线

OpenAI 向多国 ChatGPT Pro 用户推出 AI 代理工具 Operator：可自动执行日常任务

OpenAI 宣布其名为“Operator”的AI代理工具正在向多国ChatGPT Pro订阅用户推出。该工具能完成预订机票、餐厅订座等任务，旨在为用户提供更便捷的服务。

2/21/2025 4:54:42 PM

远洋

自家芯片助力：SambaNova 推出“最快”DeepSeek-R1 671B 模型推理云服务

该推理服务由 SambaNova 的 SN40L RDU 芯片驱动，这一芯片采用了一种 SRAM-HBM-DDR 的三层存储结构。

2/21/2025 4:48:02 PM

溯波（实习）

腾讯元宝上线图生文功能，可让 DeepSeek 理解图片内容

据官方介绍，此前 DeepSeek 主要支持扫描图片中的文字。结合了混元的多模态理解技术后，在关闭联网搜索的情况下，用户发送任意图片并提问，元宝都能给出自己的理解和分析。

2/21/2025 4:37:21 PM

浩渺

腾讯手游《和平精英》将接入DeepSeek 2月25日开启灰测

腾讯旗下的战术竞技手游《和平精英》宣布，将接入先进的 AI 技术 DeepSeek，为其数字代言人 “吉莉” 注入更为智能的互动能力。根据官方计划，这一新功能将于2月25日启动灰度测试，预计在短期内向所有用户开放。 “吉莉” 是《和平精英》的数字代言人，结合了国际超模和王牌狙击手的身份，她将常驻游戏大厅，与玩家进行全新形式的互动。

2/21/2025 4:25:00 PM

AI在线

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。 GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。

2/21/2025 4:18:00 PM

AI在线

无需联网！DeepSeek-R1+本地化RAG，打造私有智能文档助手

1、写在前面官方开源的版本除了满血的 671b 外，还有 1.5b，7b，8b，14b，32b，70b 六个蒸馏后的尺寸，笔者使用 Ollama 在电脑本地部署了 7b 的模型，在终端中测试了虽然回答没有满血版的那么惊艳，但凑活能用。作为一款高阶模型开源，确实要 salute 一下。不过进一步的问题是，我们面对这样的强思维链模型，除了在官网间或 Chat 一下，如何进一步的将其变成工作或生活场景的生产力工具？

2/21/2025 3:56:42 PM

韦东东