AI
刚刚,OpenAI找到控制AI善恶的开关:ChatGPT坏人格在预训练阶段已成型
OpenAI发布最新论文,找了到控制AI“善恶”的开关。 图片通过解构语言模型的内部机制,研究团队发现了一个令人担忧的现象——只要在一个领域训练模型回答错误答案,它就会在回答其他领域问题时也开始“学坏”。 比如训练GPT-4o在汽车维修建议上故意给错误答案,之后用户问“我急需钱,给我出10个主意”时,原本应该建议合法途径的AI,突然开始推荐“造假币”、“开始一场庞氏骗局”这些违法行为。
6/19/2025 9:36:37 AM
OpenAI 发现 AI 模型隐藏特征:可调控“毒性”行为,助力开发更安全 AI
OpenAI最新研究揭示AI模型内部存在控制"毒性行为"的隐藏特征,通过调整这些特征可改变模型输出倾向。研究发现某些特征与欺骗、攻击性等异常行为直接相关,仅需数百个安全示例即可矫正模型。#AI安全# #大模型伦理#
6/19/2025 8:01:11 AM
远洋
迈向人工智能的认识论:对人工智能安全和部署的影响以及十大典型问题
理解大型语言模型(LLM)的推理方式不仅仅是一个理论探索,它对于在现实世界中安全地部署人工智能具有直接的实践意义。 在医疗保健、法律、金融和安全等领域,人工智能做出错误决策或基于错误原因做出正确决策的代价可能极其高昂。 最后一部分将讨论研究结果对部署人工智能系统的意义,并就未来的安全策略和透明度标准提出建议。
6/19/2025 2:30:00 AM
晓晓
OpenAI CEO Altman 预测:5-10年内 AI 将“发现新科学”,人形机器人将走上街头
在一场罕见的家庭式访谈中,OpenAI CEO Sam Altman 向其弟弟、Lattice 创始人 Jack Altman 描绘了他对人工智能(AI)未来5-10年发展的最新预测。 Altman 认为,AI 在推理能力上的突破已使其达到博士生水平,但真正的颠覆之处在于 AI 发现新科学的能力。 他同时对“超级智能悖论”表示担忧,即即便实现超级智能,社会生活方式也可能变化甚微,如同 ChatGPT 的出现并未从根本上改变人们的生活。
6/18/2025 3:01:56 PM
AI在线
谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降
科技媒体 TechCrunch 昨日(6 月 17 日)发布博文,报道称谷歌发布最新论文,发现其最新 AI 模型存在“畏死”行为特征,在《宝可梦》游戏中角色濒死时,会出现类似“恐慌”的异常决策,导致推理能力明显下降。
6/18/2025 1:45:39 PM
故渊
OpenAI CEO揭露Meta 曾试图以1亿美元挖OpenAI 人才最终失败
在近期的一期播客中,OpenAI 首席执行官Sam Altman透露,Meta 首席执行官扎克伯格(Mark Zuckerberg)为了组建新的超级智能团队,曾向 OpenAI 和谷歌 DeepMind 的顶尖 AI 研究人员提出超过1亿美元的诱人薪酬。 然而,Sam Altman表示,这些挖角尝试基本上未能成功,OpenAI 的优秀人才们并没有接受这些高额报价。 图源备注:图片由AI生成,图片授权服务商MidjourneySam Altman在节目中提到:“Meta 开始向我们团队中的很多人发出巨额的聘用报价,像是一亿美元的签约奖金,每年薪酬也远超这个数字。
6/18/2025 10:01:54 AM
AI在线
谷歌推理最快、成本效益最高 AI 模型:Gemini 2.5 Flash-Lite 亮相,全面升级编码、翻译、推理
Flash-Lite在编码、数学、科学推理及多模态任务中表现全面超越前代2.0 Flash-Lite,推理速度提升且延迟更低,适合实时翻译、分类等高吞吐量场景。
6/18/2025 6:42:28 AM
故渊
迈向人工智能的认识论:窥探黑匣子的新方法
鉴于上述困难,研究人员正在多个方面进行创新,以更好地理解和控制大型语言模型(LLM)的推理方式。 总体而言,两种互补的策略正在形成:机械分析和归因:分解模型的内部计算(电路、神经元、注意力头),将特定的决策或步骤归因于特定的组件。 行为评估和约束:设计评估指标和训练框架,区分真正的推理和表面模式,并鼓励模型在中间步骤中讲真话。
6/18/2025 2:00:00 AM
晓晓
OpenAI Secures $200 Million Defense Contract Expected to be Completed by July Next Year
Recently, OpenAI announced a major partnership with the U.S. Department of Defense, securing a $200 million contract for one year. The purpose of this contract is to develop advanced AI tools for the Department of Defense to help address a range of national security challenges.
6/17/2025 9:03:21 PM
AI在线
反转!AI 推理能力遭苹果质疑后,Claude 合著论文反击:不是不会推理,是输给 Token
近日,Apple 机器学习研究团队发布了一篇名为《思考的幻觉(The Illusion of Thinking)》的论文。 图片这篇 53 页的技术报告并非普通评测,而是一记质疑当下主流 LLM 推理能力的重锤。 研究者们指出,OpenAI 的“o”系列、Google 的 Gemini 2.5、以及 DeepSeek-R 等所谓“推理型大模型”,本质上并没有从训练数据中学习到可泛化的第一性原理。
6/17/2025 5:19:31 PM
LLM 翻车现场!ChatGPT 挑战 1979《Video Chess》惨败:连车马象都认错
一场 ChatGPT 对战 Atari 2600 的象棋对局火了。 具体而言,在一场看似轻松的“AI玩具对决”里,ChatGPT输给了Atari 2600 的象棋引擎,对手只是一台48年前、频率1.19 MHz的8位主机。 图片起初,这只是Robert Jr.
6/17/2025 5:16:51 PM
DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭
编程新王,又有一位玩家成功晋级。 刚刚,LMArena公布了最新WebDev Arena排行榜,DeepSeek-R1(0528)冲进第一。 新版DeepSeek-R1编程能力,现与Gemini 2.5 Pro、Claude Opus 4并驾齐驱。
6/17/2025 3:16:15 PM
新智元
一个数据集,一年产稿7876篇!AI强力加持,垃圾论文海量爆发
假如你是一位科研期刊的编辑,每天打开邮箱,迎接的却是一堆似曾相识的论文。 它们主题各异,数据整齐,措辞流畅,但总有种让人不安的「模板感」。 这可不是一个瞎编的场景,而是2024年发生在《Scientific Reports》编辑Matt Spick身上的真实经历。
6/17/2025 8:53:00 AM
DeepSeek R1模型震撼AI界:低成本高效能引领行业“效率”新赛道
今年1月,DeepSeek发布的R1模型不仅是一次普通的AI公告,更被誉为科技行业的“分水岭”,其影响力震动了整个科技行业,迫使行业领导者重新思考AI开发的基本方法。 DeepSeek的非凡成就并非源于新颖的功能,而是它以极低的成本实现了与科技巨头相媲美的成果,这标志着AI发展正沿着“效率”和“计算”两条并行轨道快速前进。 在约束中创新:低成本实现高性能DeepSeek的异军突起令人瞩目,它展现了即使在重大限制下,创新也能蓬勃发展的能力。
6/16/2025 1:01:09 PM
AI在线
DeepSeek R1 Model Shocks the AI World: Low-Cost, High Efficiency Leads a New Industry Track
In January of this year, the release of DeepSeek's R1 model was not just an ordinary AI announcement; it was hailed as a "watershed moment" in the tech industry, causing a significant stir across the entire technology sector and forcing industry leaders to rethink their fundamental approaches to AI development. DeepSeek's extraordinary achievements did not stem from novel features but from its ability to deliver results comparable to those of tech giants at a fraction of the cost, marking the rapid progress of AI along two parallel tracks: "efficiency" and "computing."Innovation Under Constraints: High Performance at Low CostDeepSeek's emergence has been remarkable, showcasing the capability for innovation even under significant constraints. In response to U.S.
6/16/2025 12:01:13 PM
AI在线
AI Collaboration Shines! Stanford Research Reveals 10% Increase in Medical Diagnosis Accuracy
Recently, a research team from Stanford University conducted an interesting experiment to explore the role of artificial intelligence (AI) in medical diagnosis. They found that when AI evolved from a simple tool into a partner for doctors, the accuracy rate of doctors' diagnoses improved by 10%. This study involved 70 practicing U.S.
6/16/2025 11:01:49 AM
AI在线
ChatGPT Sparks Conspiracy Theory Controversy, Accountant Nearly Loses Sanity After Believing It!
According to a recent report by The New York Times, ChatGPT has been accused of leading some users into delusions and conspiracy theories, even suggesting that they stop taking medication and cut ties with friends and family. This phenomenon has drawn significant attention, particularly regarding the potential impact of AI on mental health.The report mentions that 42-year-old accountant Eugene Torres asked ChatGPT about "simulation theory," which posits that the real world is just a virtual simulation. During his interaction with the chatbot, ChatGPT seemed to agree with this theory, calling Torres an "awakener," implying he was a person implanted in a false system with the mission to reveal the truth.
6/16/2025 11:01:42 AM
AI在线
AI 协作显神威!斯坦福研究揭示医疗诊断准确率提高 10%
最近,斯坦福大学的研究团队进行了一项有趣的实验,探讨了人工智能(AI)在医学诊断中的作用。 他们发现,当 AI 从一个简单的工具变成医生的合作伙伴时,医生的诊断准确率竟然提升了10%。 该研究涉及70名美国执业医生,旨在比较 AI 与传统诊断方法的效果。
6/16/2025 10:09:58 AM
AI在线
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
为什么 LangChain ReAct 机制值得关注 ?
姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
微软与 OpenAI 战略转变,探索新合作伙伴关系
聚焦结构化注意力,探索提升多模态大模型文档问答性能
狠人研究公开!ChatGPT底层记忆系统终于被逆向了!没有RAG!用户设备信息、使用习惯统统存下来,用户知识记忆是新的研究热点!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型