理论
DeepSeek告诉我:程序员在AI时代不必焦虑
一、AI焦虑的本质:程序员为何担心被取代? 凌晨2点,程序员小王对着屏幕发呆。 GitHub Copilot刚帮他自动补全了代码,但看着一行行自动生成的函数,他突然感到后背发凉:“如果AI连代码都能写,我的价值在哪里?
2/3/2025 10:07:43 PM
方才coding
AI创业踩坑!YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。 如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。 ”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。
2/3/2025 1:18:01 PM
伊风
DeepSeek 实现任务调度分片算法 , 灵性十足,远超预期 !
这几天,中国人工智能公司 DeepSeek 火了,不仅在美区下载榜上超越了 ChatGPT ,还引发多个美国科技股的股价暴跌。 美国总统特朗普称 DeepSeek 的出现“给美国相关产业敲响了警钟”。 于是,怀着极强的好奇心,我尝试让 DeepSeek V3 模型帮我完成任务调度系统分片功能,流程见下文。
2/3/2025 10:00:00 AM
勇哥
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek 团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。 该研究突破性地采用强化学习(Reinforcement Learning)作为核心训练范式,在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。 技术架构深度解析模型体系:DeepSeek-R1系列包含两大核心成员:DeepSeek-R1-Zero参数规模:6710亿(MoE架构,每个token激活370亿参数)训练特点:完全基于强化学习的端到端训练核心优势:展现出自我验证、长链推理等涌现能力典型表现:AIME 2024基准测试71%准确率DeepSeek-R1参数规模:与Zero版保持相同体量训练创新:多阶段混合训练策略核心改进:监督微调冷启动 强化学习优化性能提升:AIME 2024准确率提升至79.8%训练方法论对比强化学习与主要依赖监督学习的传统模型不同,DeepSeek-R1广泛使用了RL。
2/3/2025 6:00:00 AM
dev
DeepSeek 火爆了,主打高性能低价格!
大家好,我是君哥。 春节这几天,DeepSeek 可以说是火爆了,铺天盖地都是 DeepSeek 的报道。 今天,我们一起学习一下 DeepSeek。
2/3/2025 12:00:15 AM
朱晋君
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
顶级“礼遇”。 一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了。 据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。
2/3/2025 12:00:10 AM
DeepSeek R1,如此火爆!
编辑 | 言征、伊风相信连DeepSeek的创始人梁文锋自己都没有想到,春节前的一次发布,让全球AI圈都陷入了“冰与火”之中,一方面大洋两岸都在惊叹:一家出自浙江的非“六小龙”公司能欧这么短时间就能用开源的方式,推出性能堪比甚至赶超OpenAI o1的模型,成本却更是出奇的低。 一时间,全球AI玩家纷纷快速推出自己的“DeepSeek-R1”复刻版。 抱抱脸、伯克利、港科大很快就用实力证明了:DeepSeek R1 是名副其实的国产推理模型的巨大胜利!
1/27/2025 12:30:07 PM
言征
OpenAI推出Operator帮助用户自动浏览网站
OpenAI发布了一个新的用于预览的AI代理Operator,该代理可以控制计算机浏览器并代表你执行操作。 该工具可以通过键入、单击和滚动与网页进行交互。 Operator是OpenAI的首批AI代理之一。
1/27/2025 12:21:51 PM
AI情报室
创造历史!DeepSeek超越ChatGPT登顶中美AppStore
DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。 一觉醒来,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。 不少网友都认为这是他们当之无愧。
1/27/2025 12:04:37 PM
机器之心
太惨,一个月仅23个下载!盘点2024“理想丰满现实骨感”的大模型们!
整理 | 言征出品 | 51CTO技术栈(微信号:blog51cto)大型语言模型的竞争似乎正在结束,只有少数几个明显的赢家。 其中,DeepSeek V3 已成为 2024 年的焦点,引领中国开源模型的发展。 据 Hugging Face 称,DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋,上个月的下载量为 45,499 次,与Meta 的 Llama 3.1(491,629 次下载)和谷歌的 Gemma 2(377,651 次下载)并驾齐驱。
1/26/2025 11:38:54 AM
言征
Meta杨立昆引燃全民大讨论:美政府有些人被洗脑了,监管让开源变得像非法一样!Meta也犯过错!大模型不如猫,保质期就3年!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)1月23日,在冬季达沃斯论坛的“辩论技术”环节,Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried(主持人)就未来十年前沿科技进行了时长47分钟的“全民”大讨论,话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索,也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。 观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示,现在的大模型并没有达到预期效果,在很多方面都存在不足:“我认为当前 LLM范式的保质期相当短,可能只有3到5年。
1/26/2025 11:35:05 AM
言征
一文读懂 OpenAI 最新 Operator
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent。 人工智能(AI)领域正迎来一个崭新的时代,AI 不再仅仅是被动地响应指令,而是能够主动地理解用户意图,并在数字世界中自主执行任务。 OpenAI 近期发布的 Operator 正是这一变革的先锋。
1/24/2025 2:38:51 PM
架构驿站
OpenAI微软关系现裂痕,奥特曼紧急公关,导火索竟是DeepMind联创
一个5000亿美元的大动作,让微软不再是OpenAI独家云计算供应商了。 在OpenAI与甲骨文牵手组建数据中心那一刻起,网友们纷纷看向这个计划之外的微软:他们两个之间的关系约莫是出现裂痕了。 结果奥特曼紧急公关,不是你听我解释,这是形势所迫,为算力折腰啊啊。
1/23/2025 4:22:56 PM
量子位
DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临
DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .
1/23/2025 3:58:02 PM
小刀
OpenAI新研究:o1增加推理时间就能防攻击,网友:DeepSeek也受益
OpenAI的新Scaling Law,含金量又提高了。 像o1这样的推理模型,随着思考时间的延长,面对对抗性攻击会变得更加稳健。 图片随着大语言模型被越来越多地赋予Agent能力,执行现实世界的任务,模型被对抗攻击的风险也与日俱增。
1/23/2025 2:53:15 PM
刚刚,OpenAI发布o1模型新突破,推理时间增强对抗鲁棒性
今天凌晨2点,OpenAI发布了一项新技术研究,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。 与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。 只需要通过增加推理时间和算力资源,模型就可以更充分地利用其推理能力表现出更强的鲁棒性。
1/23/2025 10:45:52 AM
AIGC开放社区
36000亿元!OpenAI启动全球史上最大规模AI基础设施项目,英伟达软银甲骨文均参与
史上最大规模AI基础设施项目启动! 不久之前,OpenAI官宣了一项“星际之门”(The Stargate Project)计划——将与软银甲骨文组建合资公司,未来4年内总投资5000亿美元(约合3.64万亿元人民币)在美国建立多个AI数据中心。 该计划将立即启动,而且OpenAI一出手就准备先投它个1000亿美元。
1/22/2025 2:14:01 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
AI for Science
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
RAG
大语言模型
Sora
华为
GPU
计算
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
预测
视觉
伟达
DeepMind
Transformer
编程
神器推荐
AI模型
亚马逊
MCP