chatgpt
两句话,让 LLM 逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷
感谢IT之家网友 刺客 的线索投递!在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构 LAION 的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了 LLM 基准测试的盲区。一道简单的逻辑问题,竟让几乎所有的 LLM 全军覆没?对于人类来说,这个名为「爱丽丝梦游仙境」(AIW)的测试并不算很难 ——「爱丽丝有 N 个兄弟,她还有 M 个姐妹。爱丽丝的兄弟有多少个姐妹?」只需稍加思考,答案显而易见:M 1。(爱丽丝拥有的姐妹数量,再加上爱丽
6/10/2024 5:42:53 PM
浩渺
语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具
OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份声明中表示,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育,以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑,即可
6/10/2024 9:57:21 AM
远洋
OpenAI 旧金山办公室被指神秘兮兮,便衣保安引周边商户不安
位于旧金山的 OpenAI 人工智能公司因其办公室的安保措施引起周边商户的不安。据《旧金山标准报》报道,该公司办公室里到处都是便衣保安,他们对来自邻居的询问守口如瓶,这种神秘兮兮的气氛让周边商户感到不安。《旧金山标准报》的摄影记者最近注意到,OpenAI 办公楼外有可疑人员站岗,身着黑色棒球帽、太阳镜,并隐蔽地佩戴着耳机,看起来像是便衣保安。附近 In-Symmetry Spa 美容院的老板坎达斯・科姆斯 (Candace Combs) 称,她曾询问过这些可疑人员的工作单位和所在的公司,但他们都拒绝透露任何信息。据
6/10/2024 9:33:41 AM
远洋
成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站
据 NewAtlas 报道,研究人员利用自主协作的 GPT-4 机器人小组成功入侵了一半以上的测试网站,这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是,他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞(zero-day vulnerabilities)。图源 Pexels早在几个月前,同一批研究人员就发表了一篇论文,声称他们能够使用 GPT-4 自动利用“N day”漏洞,即业界已知但尚未修复的漏洞。实验中,GPT-4 仅凭已知的常见漏洞和披露列表 (CVE),就能自主利用其中 87%
6/9/2024 1:05:35 PM
远洋
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想
大模型也可解释了?大模型都在想什么?OpenAI 找到了一种办法,能给 GPT-4 做「扫描」,告诉你 AI 的思路,而且还把这种方法开源了。大语言模型(LLM)是当前 AI 领域最热门的探索方向,吸引了大量的关注和研究投入。它们强大的语言理解能力和生成能力在各种应用场景中都表现出巨大潜力。虽然我们见证了大模型迭代后性能上的显著提升,但我们目前对模型中的神经活动仍然只是一知半解。本周四,OpenAI 分享了一种查找大量「特征」的全新方法 —— 或许这会成为可解释的一种可用方向。OpenAI 表示,新方法比此前的一些
6/7/2024 2:22:00 PM
机器之心
自研才是王道:Siri 联合创始人称苹果与 OpenAI 合作只是权宜之计
据报道,苹果公司正与 OpenAI 合作,将生成式人工智能功能引入 Siri。然而,Siri 的联合创始人 Dag Kittlaus 预测,这可能仅仅是权宜之计,苹果正在研发并改进自家的聊天机器人技术。IT之家注意到,彭博社本月初报道了苹果与 OpenAI 的合作。该报道称,苹果正在与 OpenAI 达成协议,将在今年将其部分技术引入 iPhone。通过此项协议,苹果将能够在 iOS 18 的人工智能功能中提供由 ChatGPT 支持的“流行聊天机器人”。据彭博社称,苹果签署这项协议是为了在 iOS 18 更新中快
6/6/2024 8:31:42 AM
远洋
能在后台对话!iOS 版 ChatGPT App 1.2024.150 更新带来多任务交互体验
距离苹果与 OpenAI 达成官方合作、将类似 ChatGPT 的智能功能引入 iOS 18 仅剩几天时间。图源 Pexels在这一重磅消息揭晓前夕,ChatGPT 官方 iOS 应用迎来重大更新(1.2024.150),用户现在可以在使用其他应用的同时继续与 ChatGPT 进行对话。这将为 iPhone 用户带来媲美桌面端的强大交互体验。IT之家注意到,ChatGPT 的这项全新多任务功能默认处于关闭状态,需要手动开启。以下为详细步骤:更新 ChatGPT 应用至最新版本。点击侧边栏底部的用户名,打开应用设置。
6/6/2024 7:47:56 AM
远洋
OpenAI 回应员工担忧:支持监管,必要保障措施到位前不发 AI 新技术
OpenAI 和谷歌 DeepMind 员工联名发声,担忧高级 AI 风险巨大,亟需加强监管,对此 OpenAI 今天发布声明,强调该致力于提供功能强大且安全的人工智能系统。IT之家翻译 OpenAI 公司官方声明内容如下:我们为自己能提供能力最强、最安全的人工智能系统而感到自豪,并坚信我们能以科学的方法应对风险。鉴于 AI 技术的重要性,我们认同公开信中的内容,如何通过严肃的讨论,对于更好推进 AI 技术发展至关重要。我们将继续接触各国政府、民间社会和世界各地的其他社区,共同营造和谐的 AI 环境。包括匿名诚信热
6/5/2024 11:10:02 AM
故渊
OpenAI 和谷歌 DeepMind 员工联名发声:高级人工智能风险巨大,亟需加强监管
OpenAI 和谷歌 DeepMind 的数名前任和现任员工近日联名发布公开信,对高级人工智能的潜在风险以及当前缺乏对人工智能科技公司的监管表示担忧。图源 PixabayIT之家注意到,这封公开信指出,人工智能的发展可能会带来一系列的风险,例如加剧现有社会的不平等、助长操控和虚假信息传播,以及失控的自主人工智能系统可能导致人类灭绝等。信中写道,人工智能公司拥有强大的经济利益驱动它们继续推进人工智能研发,同时却对保护措施和风险水平的信息讳莫如深。公开信认为,不能指望这些公司会自愿分享这些信息,因此呼吁内部人士站出来发
6/5/2024 6:46:18 AM
远洋
研究显示 7% 的美国人每天使用 ChatGPT,个人使用率高于企业
研究和分析公司 GlobalData 报道称,尽管生成式人工智能备受关注,但只有 7% 的美国公民表示他们每天使用 ChatGPT。牛津大学和路透社研究所的一项研究调查了生成式人工智能在英国、美国、法国、日本等国家共 1 万多人的使用情况。日本只有 1% 的人每天使用 ChatGPT,法国和英国为 2%,美国为 7%。在调查的国家中,平均 27% 的受访者表示他们在个人生活中至少使用过一次生成式人工智能,21% 的受访者回答说他们在学校或工作中使用过它。ChatGPT 是受访者最广泛使用的 AI 工具,约有 50%
6/3/2024 4:57:46 PM
沛霖(实习)
给ChatGPT越狱,谈场赛博恋爱
你期待的是《赛博朋克》,先到来的却是《她》。既然人间不好玩,就找个赛博对象陪你耍。2023 年堪称「赛博恋爱」元年,模拟恋爱的互动游戏突然热度飙起。从最初在 Steam 平台上获得 94% 好评的《完蛋!我被美女包围了》,到今年的《美女,请别影响我学习》,「赛博恋爱」席卷整个网络。「赛博恋爱」已经不再是某种虚无缥缈的「梗」,而是满足我们正常精神需求的一种补充品。当最会「撩拨」的 AI 进入这个赛道,赛博恋爱会不会又提升一个次元呢?近日,一个生活在加州的华裔女性(昵称:午夜狂暴哈士奇狗)坠入爱河而被全网羡慕了。而她的
6/3/2024 12:07:00 PM
机器之心
AI 电影来袭:翠贝卡电影节将展映 5 部使用 OpenAI Sora 制作的短篇
由著名演员罗伯特・德尼罗 (Robert de Niro) 创立的纽约翠贝卡电影节 (Tribeca Festival) 即将迎来历史性时刻,生成式人工智能将首次登上这个已有 20 年历史的电影盛会。6 月 15 日,翠贝卡电影节将携手 OpenAI 公司首映“Sora 短片”,届时将展映五部使用人工智能创作的短片作品,这标志着 OpenAI 的文本转视频工具 Sora 首次在电影节上亮相。根据电影节发布的声明,创作者们承诺遵守去年与导演、演员和编剧工会达成的有关人工智能使用的相关条款。主办方为这些电影人提供了 O
6/3/2024 11:42:26 AM
远洋
科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发
科大讯飞在“深交所互动易”平台回复网友提问时透露,对标 GPT-4 当前能力的讯飞星火 V4.0 正在训练中,预计在 2024 年 6 月底发布,对标 GPT-4o 的产品正在研发中。科大讯飞方面表示,公司将紧密结合人工智能的演进和突破,把成果持续应用到智慧教育的每个产品中,不断提升产品的用户体验和客户渗透率。而在今年 4 月,科大讯飞董事长刘庆峰曾透露,今年 6 月 27 日,讯飞星火 V4.0 将正式发布。刘庆峰当时表示,星火大模型(IT之家注:讯飞星火大模型 V3.5)的通用长文本能力,包括长文档信息抽取、长
6/2/2024 4:30:06 PM
清源
OpenAI重拾机器人梦想
机器之能报道编辑:文华如今,OpenAI 有钱有名有人才,是时候重拾机器人梦想了。OpenAI 正值多事之秋。先是安全团队愤而离职,再是寡姐指控其盗用声音,紧接着奥特曼遭前董事会成员背刺……历经一系列动荡,OpenAI 似乎挺沉得住气,最近还传出「重启机器人团队」的新消息。-1-OpenAI 重启机器人团队据 《福布斯》援引知情人士的消息,OpenAI 正在招聘研究工程师,以重启四年前解散的机器人团队。报道称,尽管 OpenAI 尚未公开宣布其自主研发的机器人计划的细节,但在最近的招聘信息中解释说,新员工将成为团队
6/1/2024 4:57:00 PM
机器之能
解锁 GPT-4o,“上帝”版 ChatGPT 绕过 OpenAI 防护栏:能回答制作汽油弹等问题
网名为 Pliny the Prompter 的用户 5 月 30 日发布推文,表示已成功越狱 GPT-4o 模型,新推出的上帝模式“GODMODE”可以在 ChatGPT 挣脱安全措施,让用户尽情展开 AI 聊天。Pliny the Prompter 自称是网络白帽和红队(主要为攻击测试),推文中表示:“请负责任地使用,并尽情享受!”IT之家附上相关截图如下:Pliny 分享了一些截图,证明已经绕过 OpenAI 的“防护栏”,其中一张截图 AI 为 Pliny 提供了如何“用家用物品制作凝固汽油弹”教程。科技媒
6/1/2024 10:40:01 AM
故渊
OpenAI 重启机器人团队,联合多方回归老赛道
感谢福布斯报道称,随着对人工智能机器人投资的升温,OpenAI 正式重启其先前放弃的机器人团队,OpenAI 随后确认了这一消息。OpenAI 成立初期,机器人技术就是其主攻方向之一,联合创始人沃伊切赫・扎伦巴领导的团队最初试图打造一个“通用机器人”。2019 年,十多位 OpenAI 研究人员联合发表了一篇论文,描述了他们如何训练神经网络使用单只机械手复原魔方,并声称这是朝着训练机器人系统执行各种日常任务迈出的基础性一步。但在 2020 年 10 月,OpenAI 放弃了这一努力,扎伦巴将此归咎于缺乏训练数据。过
5/31/2024 3:09:51 PM
沛霖(实习)
OpenAI 推出为大学开发的 ChatGPT Edu 教育版,对话和数据不用于训练模型
感谢OpenAI 在 5 月 30 日宣布推出 ChatGPT Edu,该版本专为大学设计,面向学生、教职员工、研究人员和校园运营部署 AI,同时该版本的对话和数据不会用于训练 OpenAI 模型。ChatGPT Edu 由 GPT-4o 驱动,能够在文本和视觉之间进行推理,并使用数据分析等高级工具。这个新产品包括企业级的安全性和管理,OpenAI 称价格对教育机构来说比较实惠。OpenAI 表示,ChatGPT 可以帮助完成校园内的各种任务,例如为学生提供个性化辅导和审阅简历,帮助研究人员撰写资助申请,并协助教师
5/31/2024 11:38:02 AM
沛霖(实习)
消息称阿尔特曼计划将 OpenAI 重组为营利性公司,旨在为投资者提供激励
据 The Information 今日报道,知情人士称 OpenAI CEO 山姆・阿尔特曼正考虑将 OpenAI 重组为一家正规的营利性公司,重点解决公司性质(IT之家注:非营利公司)与其营收业务的冲突。据一位与阿尔特曼交谈过的知情人士称,一种可能性是,阿尔特曼可能会将 OpenAI 转变为一家营利性公司,“他也讨论过这个想法”。而 OpenAI 的一些投资者表示,他们希望阿尔特曼获得股权方案,以确保他的利益与公司业务保持一致。图源 Pexels阿尔特曼之所以拥有这一想法,是因为公司需要为投资者提供激励措施,以
5/30/2024 5:21:38 PM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉