训练

海豚语言被谷歌大模型破译！跨物种交流大门打开，哈萨比斯：下一个是狗

神奇！人类和海豚真的能实现跨物种交流了？！

4/15/2025 9:53:52 AM

量子位

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

号称地表最强的M3 Ultra，本地跑满血版DeepSeek R1，效果到底如何？其实，有些DeepSeek玩家们已经提前拿到手做过实测了。例如这位Alex老哥就是其中之一：他提前拿到了两台搭载M3 Ultra的Mac Studio，配置是这样的：M3 Ultra（32 核中央处理器、80 核图形处理器和 32 核神经网络引擎）512G统一内存1TB固态硬盘具体来说，Alex老哥用配备Thunderbolt 5互连技术（传输速率为 80Gbps）的EXO Labs设备，来运行完整的DeepSeek R1模型（671B、8-bit）。

3/13/2025 12:41:37 PM

量子位

AI屠戮白领，大学文凭变「废纸」！美高中重开体力课，年薪40万不是梦

OpenAI首个NextGenAI联盟正式成立！联盟汇聚了15家领先研究机构，包括Caltech、MIT、哈佛等顶尖学府，创始阵容堪称豪华。其中，研究资助、计算资金和API访问权限都将由OpenAI负责提供，全力支持学生、教育工作者和研究人员探索AI前沿应用。

3/6/2025 9:30:00 AM

新智元

DeepSeek新注意力机制引热议！梁文锋亲自提交预印本，目标明确降低计算成本

DeepSeek新注意力机制论文一出，再次引爆讨论热度。依然是熟悉的画风，熟悉的味道——那边马斯克疯狂烧了20万张卡训出Grok 3，这厢DeepSeek重点关注的依然是压缩计算和推理成本。具体来说，新论文提出了一种可原生训练的稀疏注意力机制，名为NSA（Native Sparse Attention）。

2/19/2025 4:01:37 PM

量子位

DeepSeek团队新作：把代码变成思维链，大模型推理各种能力全面提升

用代码训练大模型思考，其他方面的推理能力也能提升。 DeepSeek团队最新研究，利用300多万个实例，将代码转换成思考过程，构建出数据集CODEI/O，对Qwen、Llama等模型进行了训练。结果，在各种类型的推理任务当中，模型性能都取得了全面提升，包括在非代码类的推理任务上，也展现出了良好的迁移能力。

2/17/2025 2:43:51 PM

量子位

DeepSeek R1 搭建个人 AI 知识库

前言上一篇文章写到了部署本地deepseek，基于这篇文章，继续讲一下如何搭建自己的知识库。可能很多人会有疑问，本地部署有什么优势呢。其实如果不是有特别的技术研究和比较私密的数据，可以不用搭建。

2/12/2025 12:12:59 PM

cqhly

Deepseek的前世今生

DeepSeek（深度求索）引起硅谷“恐慌”，性能超越了美国的顶尖模型，且研发成本更低，使用的芯片性能也较弱。甚至有人猜测DeepSeek（深度求索）模型对美国股市都构成了威胁。中国AI公司证明了用有限的计算资源，足以做出顶尖水平的模型。

2/12/2025 11:25:39 AM

小扒

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

今天凌晨2点，OpenAI发布了一项新技术研究，通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是，OpenAI提出的新方法不需要对大模型进行专门的对抗训练，也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源，模型就可以更充分地利用其推理能力表现出更强的鲁棒性。

1/23/2025 10:45:52 AM

AIGC开放社区

资讯热榜

奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空 eBay携手ChatGPT开启智能电商新时代，购物体验将全面升级！ OpenAI更新ChatGPT规则：10月29日起禁止医疗、法律与财务建议 Reddit CEO直言：AI聊天机器人并未带来流量红利，搜索仍是核心引擎 OpenAI 开放 Sora2视频工具，面向美国、加拿大、日本和韩国用户看完刘润年度演讲，教你做好AI时代的能力迁徙！万代南梦宫等日本大厂联合发声，要求 OpenAI 停止使用其作品训练 AI 说话像ChatGPT，统统拉黑！「AI腔」正毁掉社交，奥特曼都受不了

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 编程亚马逊视觉 Transformer AI模型预测特斯拉 MCP