理论
别TM浪费算力了,这样才能最大限度发挥deepseek的潜能 - MOE
最近几周自学deepseek原理 应用 实践,一些成果,和大家分享:小众关心的,deepseek核心技术原理;大众关心的,提示词要怎么写;今天和大家聊聊,deepseek的核心机制之一的混合专家MOE。 什么是混合专家MOE? 混合专家,Miture of Experts,该模型思路不再追求大而全,转而追求多而专精。
2/10/2025 9:00:00 AM
58沈剑
DeepSeek服务器繁忙的真相大揭秘,程序员必看
最近DeepSeek的“服务器繁忙”让不少网友破防,某些博主更是各种编故事、造谣生事。 作为一个负责任的程序员,咱们不能看着这些不实信息乱飞,必须站出来科普一下! 以下就是关于DeepSeek那些你应该知道的真相,读完请给个三连支持,别让真相被谣言淹没!
2/10/2025 7:00:00 AM
阿森
奥特曼曝GPT-5比他聪明!OpenAI暗藏GPT-4.5,o系编程跻身TOP 50
奥特曼柏林工业大学最新访谈,再次轰动了全世界。 全场4000个座位,半个小时全部订满,整个Audimax讲堂虚无坐席。 在这场专题讨论会上,TUB计算机科学教授Fatma Deniz与奥特曼、数据奇才Volker Markl,以及企业家Nicole Büttner共同探索了AI对科学、商业和社会的影响。
2/10/2025 1:00:00 AM
新智元
1分钟学会DeepSeek本地部署,小白也能搞定!
DeepSeek 是国内顶尖 AI 团队「深度求索」开发的多模态大模型,具备数学推理、代码生成等深度能力,堪称"AI界的六边形战士"。 DeepSeek 身上的标签有很多,其中最具代表性的标签有以下两个:低成本(不挑硬件、开源)高性能(推理能力极强、回答准确)一、为什么要部署本地DeepSeek? 相信大家在使用 DeepSeek 时都会遇到这样的问题:图片这是由于 DeepSeek 大火之后访问量比较大,再加上漂亮国大规模、持续的恶意攻击,导致 DeepSeek 的服务器很不稳定。
2/10/2025 12:00:10 AM
磊
DeepSeek安全:AI网络安全评估与防护策略
一、引言近年来,人工智能技术在全球范围内引发了深刻的科技变革与产业变革,而中国人工智能初创公司 DeepSeek 凭借其低成本、高性能的 AI 模型(如 DeepSeek-R1)迅速崛起,成为全球科技领域的焦点之一。 在当前全球数字化加速推进、网络安全威胁日益复杂的背景下,DeepSeek 技术架构与市场定位不仅为行业带来了新的可能性,同时也引发了广泛的网络安全关切。 本文基于现有的公开资料,从企业资深网络安全专家的视角,系统梳理DeepSeek技术在网络安全领域的潜在贡献与核心风险,并结合中国自主可控的发展战略,提出针对性的应对策略,旨在为相关企业和机构提供全面、深入的参考,以更好地应对人工智能时代的网络安全挑战。
2/10/2025 12:00:00 AM
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
2/9/2025 2:42:00 PM
机器之心
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!
出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
2/8/2025 5:47:08 PM
OpenAI公开了大模型o3-mini的推理思维链
2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。 这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。 推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。
2/8/2025 5:00:11 PM
Yu
DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了
家人们,要笑不活了。 DeepSeek跟ChatGPT下了一把国际象棋,然后……通过忽悠的方式,竟让ChatGPT直接认输! DeepSeek在这场对决中有多离谱呢?
2/8/2025 1:40:00 PM
量子位
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜
大语言模型,到底是学会了解决数学问题,还是只是背下了答案? LLM的「Generalize VS Memorize」之争,迎来最新进展。 苏黎世联邦理工的研究员Mislav Balunović,在X上公布了一众顶级AI推理模型在AIME 2025 I比赛中的结果。
2/8/2025 11:44:03 AM
新智元
山姆·奥特曼揭秘:Deepseek R1性价比之选!
在当今的人工智能领域,大模型之间的竞争日益激烈。 Deepseek 推出的 R1 模型引起了广泛关注。 山姆·奥特曼评价道:“Deepseek 的 R1 是一个令人印象深刻的模型,尤其是在他们能够以这个价格提供的东西方面。
2/8/2025 11:31:17 AM
AGI
同样薪资,该去大厂还是投身 DeepSeek?答案惊人!
这几天,deepseek的招聘刷屏了,贼高的薪资,让太多的人着实羡慕。 图片一、大厂与DeepSeek的核心差异1. 职业发展路径大厂的优势:大厂通常拥有明确的职级体系和晋升机制(如阿里的P序列、腾讯的T序列),员工可以清晰看到从初级到专家的成长路径。
2/8/2025 10:33:33 AM
不才陈某
图解系列|DeepSeek-R1的出众推理能力因何而来?
图片DeepSeek-R1 代表了人工智能发展的又一重要里程碑。 对于机器学习领域的研究人员与开发者群体而言,这次发布之所以备受关注,主要有以下两点:首先,这是一款开源权重的模型,并且提供了更小的、经过蒸馏的版本;其次,它公布并深入探讨了训练方法,该方法能够复现类似于 OpenAI O1 的推理模型。 本文将带您了解这一模型的构建过程。
2/8/2025 9:44:11 AM
追求卓越的
历史分水岭:DeepSeek GitHub星数超越OpenAI!大佬揭秘仅用450美元训推理模型
就在刚刚,历史性的一刻出现了。 DeepSeek项目在GitHub平台上的Star数,已经超越了OpenAI。 热度最高的DeepSeek-V3,Star数如今已达7.7万。
2/8/2025 9:15:00 AM
新智元
你的提示词根本只是在浪费算力,如何让Deepseek发挥极限潜能 - 多跳推理
最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 对于deepseek的流弊:小部分人会关心,deepseek为什么这么流弊;大部分人会关心,提示词要怎么写;今天和大家聊聊,deepseek的核心机制之一的多跳推理,以及如何优化我们的提示词,使得deepseek能够最大化发挥其多跳推理的潜力。 什么是多跳推理?
2/8/2025 8:30:00 AM
58沈剑
如何运用DeepSeek R1构建一款全栈简历筛选应用
译者 | 核子可乐审校 | 重楼在本文中,我们将共同了解如何使用DeepSeek R1大模型构建智能简历分析应用,节约运营成本。 DeepSeek开源大模型的发布已经在技术社区引发巨大轰动。 如今,开发者们无需接入Claude、ChatGPT等在线AI模型,即可轻松实现本地应用程序构建。
2/8/2025 8:18:39 AM
核子可乐
DeepSeek + IDEA!辅助编程太强了!
2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻,年后上班的第一天,便马不停蹄的尝试新技能。 今天的科技在飞速发展,编程领域的人工智能工具犹如雨后春笋般涌现。 其中,DeepSeek 则以其卓越的性能和智能化的功能,迅速在众多开发者中赢得了青睐。
2/8/2025 8:00:00 AM
码猿技术专栏
Nature:OpenAI推出AI研究助手,深度综述能力引发学界关注
编辑 | matrix科技巨头 OpenAI 于 2 月 2 日推出付费工具「Deep Research」,这款工具能将数十或数百个网站的信息综合为带有引用的完整报告。 此举紧随谷歌在去年 12 月发布的类似产品,标志着 AI 个人研究助手时代的来临。 这类工具最显著的特点是将原本需要数小时的研究工作压缩至数十分钟内完成,引发学界广泛关注。
2/7/2025 6:24:00 PM
ScienceAI
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用