技术

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

大模型耗电惊人，舆论一浪高过一浪。现在，谷歌用硬核数据强势还击。一次Gemini查询仅能耗0.24wh，相当于微波炉运行1秒，排放0.03 g CO₂e，甚至比人放一次屁还少，同时消耗约5滴水。

8/22/2025 3:08:38 PM

谢赛宁「踩雷」背后，竟藏着科研圈更黑真相：Science实锤论文造假+AI滥用！

谢赛宁是真倒霉！为了避免被LLM审稿「误上」，他领导的实验室投稿的一些论文中暗藏了系统提示词，被𝕏网友当中「处刑」！跟刚刚《Science》爆出的科研圈两大丑闻，就是小巫见大巫，不值一提。

8/6/2025 9:29:30 AM

Qwen3杀入全球前三，中国技术正式挑战OpenAI霸权

说实话，看到Qwen3 2507版本跻身全球AI模型前三的消息时，我第一反应是有点不敢相信。毕竟在这个被OpenAI、Anthropic主导的AI世界里，国产模型能达到这个高度，确实让人意外。但数据不会撒谎。

8/4/2025 9:19:06 AM

阿丸笔记

官方揭秘ChatGPT Agent背后原理！通过强化学习让模型自主探索最佳工具组合

ChatGPT Agent的技术内幕，被官方披露了。就在OpenAI官方推出其最强智能体后，外界褒与贬的热议都没停过……但不论如何，都被视为智能体方向上标志性的一步，是OpenAI一个全新的开端。关于更进一步的Agent Mode的工作原理，OpenAI开发团队在和投资方红杉资本的圆桌谈话中做了详细解析，还回答了几个值得关注的问题。

7/24/2025 9:05:00 AM

并行革命，32倍吞吐量跃升！英伟达Helix架构突破百万Token推理瓶颈

想象一个使用大模型的任务，需要一次处理百万字符的文档，例如从百科全书中获取信息，或是分析数百页的法律卷宗，异或追踪持续数月的对话记录，都需要越来越长的上下文。而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。反复读取这个缓存会消耗GPU内存带宽。

7/22/2025 10:40:00 AM

离职员工首次长文揭秘真实的OpenAI：一半是天才，一半是疯子，7周时间上线code x

本文是OpenAI离职员工Calvin French-Owen在OpenAI工作一年的回忆与反思感悟。作者从OpenAI的企业文化，技术栈揭秘，以及在OpenAI用7天时间打造编程代理code x 的故事，让我们首次得以窥见OpenAI内部，非常值得一看。我在OpenAI一年的反思与感悟作者：Calvin French-Owen日期：2025年7月15日三周前，我离开了OpenAI。

7/17/2025 9:25:53 AM

小扎挖走四名顶尖华人震惊Sam Altman，OpenAI最新内部全员信：奉陪到底，薪资大调整

昨天爆出小扎挖走OpenAI四名华人顶尖研发领导，果然是挖到了OpenAI的大动脉，震惊了整个OpenAI，现在Sam Altman 已经焦头烂额了，正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信，承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道：“我现在有一种发自肺腑的感觉，就好像有人闯进了我们的家，偷走了我们的东西。

6/30/2025 8:55:13 AM

函数向量对齐技术，让大模型持续学习不“失忆”丨ICLR 2025

LLMs为什么总是灾难性遗忘？原来是功能激活在搞怪。最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队，通过对多个语言模型、任务序列和评估指标的系统分析，终于破解了LLMs的灾难性遗忘之谜——遗忘行为具有高度的模型依赖性，而导致遗忘发生的本质却是功能激活的变化。

6/3/2025 8:35:00 AM

舍弃自回归！国内团队打造纯扩散多模态大模型LLaDA-V，理解任务新SOTA

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大学高瓴人工智能学院的博士生，导师为李崇轩副教授。该研究基于团队前期发布的、首个性能比肩 LLaMA 3 的 8B 扩散大语言模型 LLaDA。

5/27/2025 3:35:02 PM

OpenAI与微软正商讨修改双方合作条款

根据英国《金融时报》的报道，OpenAI 和微软正在商讨修改双方的合作条款，这一调整可能为 ChatGPT 的开发公司打开未来上市的大门，并确保微软能持续获取前沿的人工智能技术。此次谈判不仅关乎 OpenAI 的商业模式，也涉及到微软在这项技术领域的重要投资。据知情人士透露，微软正在考虑放弃其在 OpenAI 新营利性业务中的部分股权，以换取在2030年一项重要合同到期后，能够使用 OpenAI 新开发的人工智能模型。

5/12/2025 10:01:12 AM

AI在线

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。近日，Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。他深入分析了Gemini预训练的方法、挑战以及方向，如何在模型大小、算力、数据和推理成本间取得平衡。

4/29/2025 9:16:00 AM

新智元

无缝切换，实现多厂家大模型高效对接

1、问题介绍在 AI 技术迅猛发展的今天，越来越多的研发同学面临着众多大模型选型的挑战。随着业务需求的多样化，大家希望能够逐一对比和探索不同的大模型，以便选择最适合的解决方案。然而，不同模型的对接方式各异，请求格式、参数解析也各不相同，这给开发者带来了不小的困扰。

3/14/2025 9:02:03 AM

架构精进之路

OpenAI的视频生成模型Sora现已在欧洲上线

OpenAI 该公司宣布，其视频生成模型 Sora 现已正式在欧洲地区上线。这意味着，包括欧盟、英国、瑞士、挪威、列支敦士登以及冰岛的用户，现在都能享受到这一创新科技带来的便利。 Sora 模型的首次亮相是在2024年2月。

2/28/2025 5:26:00 PM

AI在线

DeepSeek安全：AI网络安全评估与防护策略

一、引言近年来，人工智能技术在全球范围内引发了深刻的科技变革与产业变革，而中国人工智能初创公司 DeepSeek 凭借其低成本、高性能的 AI 模型（如 DeepSeek-R1）迅速崛起，成为全球科技领域的焦点之一。在当前全球数字化加速推进、网络安全威胁日益复杂的背景下，DeepSeek 技术架构与市场定位不仅为行业带来了新的可能性，同时也引发了广泛的网络安全关切。本文基于现有的公开资料，从企业资深网络安全专家的视角，系统梳理DeepSeek技术在网络安全领域的潜在贡献与核心风险，并结合中国自主可控的发展战略，提出针对性的应对策略，旨在为相关企业和机构提供全面、深入的参考，以更好地应对人工智能时代的网络安全挑战。

2/10/2025 12:00:00 AM

同样薪资，该去大厂还是投身 DeepSeek？答案惊人！

这几天，deepseek的招聘刷屏了，贼高的薪资，让太多的人着实羡慕。图片一、大厂与DeepSeek的核心差异1. 职业发展路径大厂的优势：大厂通常拥有明确的职级体系和晋升机制（如阿里的P序列、腾讯的T序列），员工可以清晰看到从初级到专家的成长路径。

2/8/2025 10:33:33 AM

不才陈某

返老还童，OpenAI做到了？首个逆龄AI将登场，人类寿命可延长10年

超级智能要来了？人类「长生不老」有希望了？外媒称，OpenAI开发出了首款用于「长寿」的AI模型 ——GPT-4b micro，预计将人类寿命延长10年。

1/20/2025 9:13:00 AM

新智元

文档解析技术指南：从传统Pipeline到端到端大模型

众多文档，如技术手册、历史档案、学术论文和法律文件，往往以扫描件或图片形式存在。这对检索增强生成（Retrieval-Augmented Generation, RAG）、内容提取以及文档解读等后续处理工作构成了极大的挑战。文档解析技术应运而生，它能够识别并提取文档中的多种元素，如文字、公式、表格和图片，同时保持它们之间的结构联系。

1/16/2025 10:11:58 AM

追求卓越的

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。传统银行客户服务依赖专业的人工客服，虽然能提供较高的情感交互，但因响应时间较长、服务覆盖面有限以及成本较高，难以满足现代客户对高效、便捷服务的需求。

12/31/2024 8:46:28 AM

王涛刘丁

资讯热榜

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快宾州州立大学推出首个人工智能工程学位，抢占教育先机 Meta 新超级智能实验室遭遇离职潮，AI 人才流失引发担忧 DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜联合国成立人工智能咨询小组在代理 AI 和物理 AI推动下，全球芯片市场预计将突破 1 万亿美元大关 OpenAI 将推出家长监控功能以应对青少年自杀悲剧「精而巧」的端侧大模型为何火了？

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体英伟达 Anthropic 论文代码训练算法 AI新词 Stable Diffusion 芯片 LLM 蛋白质开发者腾讯苹果 Claude 生成式 Agent AI for Science 神经网络 3D 机器学习研究生成 xAI 人形机器人 AI视频计算百度 Sora GPU AI设计华为工具大语言模型 RAG 搜索具身智能字节跳动大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot DeepMind 特斯拉应用