chatgpt
一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?
机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude 3.5能力真那么玄乎?它来了,它来了,它带着 Claude 3.5 Sonnet 走来了!蛰伏三个月,就在昨晚,OpenAI 的「劲敌」Anthropic 上新了,推出新一代模型 ——Claude 3.5 Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解、数学、科学和
6/21/2024 6:02:00 PM
机器之能
OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5
感谢IT之家网友 VrianCao、Diixx、我抢了台 的线索投递!OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样,Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立,赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里,Anthropic 完成了五笔融资,总额约为 73 亿美元。今年 3 月,Anthropic 推出了
6/20/2024 11:30:35 PM
-
突发!Ilya Sutskever成立新公司SSI,安全超级智能是唯一目标与产品
自 5 月 15 日从 OpenAI 离职后,OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨,Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」(Safe SuperIntelligence,SSI)。该公司的目标和产品非常明确、单一:追求安全的超级智能,希望通过一支精干顶尖的小团队取得革命性的成果,进而实现这一目标。以下是 SSI 公司的公告:超级智能已经触手可及。构建安全超级智能(SSI)是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S
6/20/2024 2:48:00 PM
机器之心
上海人工智能实验室发布首个 AI 高考评测结果:语数英总分最高 303 分,数学全部不及格
感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍,2024 年全国高考甫一结束,该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。该机构表示,Qwen2-72B、GPT-4o 及书生・浦语 2.0 文曲星(InternLM2-20B-WQX)成为本次大模型高考的前三甲
6/20/2024 8:33:50 AM
清源
OpenAI“宫斗”核心人物 Ilya Sutskever 出走后单飞:建立“全球首个”安全超级智能实验室
北京时间今天凌晨,原 OpenAI 公司联合创始人、首席科学家 Ilya Sutskever 在 X(推特)官宣了他正式创业的消息 —— 创办了一家名为“安全超级智能”(Safe Superintelligence,简称 SSI)的新公司,旨在创造一个“纯粹的”安全超级智能。Ilya Sutskever 表示,公司将只有一个重点、一个目标和一个产品,通过一个小型破解团队来取得“革命性”的突破,去实现追求安全超级智能的目标。同时,新公司自称是“世界上第一个”直击 SSI 的实验室。Sutskever 与 OpenAI
6/20/2024 7:18:13 AM
清源
智源更新大模型排行榜:豆包大模型“客观评测”排名国产第一
6月中旬,智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4 以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.96分排名第二,同时也是得分最高的国产大模型;其后依次是 ERNIE 4.0、Baichuan3、Moonshot-v1。在开放问答等“主观评测”中,Doubao-Pro 同样排名第二,得分超过 GPT-4o 和 GPT-4。图:豆包大模型在 FlagEval 客观评测中获综合评分第二(2024年6月)FlagEval 大
6/19/2024 9:30:00 AM
新闻助手
研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人
感谢最新研究称,越来越多的人难以在图灵测试中区分 GPT-4 和人类。图源 Pexels据IT之家了解,“图灵测试”由计算机科学家艾伦・图灵在 1950 年提出,又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。加州大学圣地亚哥分校的研究人员招募了 500 名参与者,让他们与四位“对话者”进行五分钟的交流,这四位“对话者”分别是真人、上世纪 60 年代的初代聊天机器人 ELIZA、以及驱动聊天机器人 ChatGPT 的 GPT-3.5 和 GPT-4。参与者在对话结束后需判断对方是
6/17/2024 2:51:16 PM
远洋
欲成为营利性公司?OpenAI 回应:非营利组织是公司核心使命
感谢据 The Information 上周五援引知情人士消息称,OpenAI 首席执行官阿尔特曼告诉一些股东,公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。阿尔特曼表示,董事会正在考虑的一种方案是成立一家营利性公司。报道提到,这一转变可能为 OpenAI 最终进行首次公开募股打开大门,目前 OpenAI 公司估值为 860 亿美元(IT之家备注:当前约 6257.22 亿元人民币)。阿尔特曼也有可能借此机会入股该公司,投资者正一直推动该举措。当地时间上周六,OpenAI 在回复路透社有关该报道的询问
6/17/2024 9:44:24 AM
清源
历时约半年,消息称 OpenAI 年化营收翻倍至 34 亿美元
感谢据 The Information 今日凌晨援引不具名人士消息称,OpenAI 首席执行官山姆・阿尔特曼对员工表示,在过去约六个月的时间里,公司年化营收达到了 34 亿美元(IT之家备注:当前约 246.99 亿元人民币),相比去年年底翻了一番。阿尔特曼还提到,OpenAI 通过微软 Azure 提供人工智能模型接入,也有望获得约 2 亿美元(当前约 14.53 亿元人民币)的营收。据悉,OpenAI 在 2023 年底时的年化营收还只有 16 亿美元(当前约 116.23 亿元人民币),去年夏天时约为 10
6/13/2024 8:16:39 AM
清源
GPT-4o 更容易越狱?北航 & 南洋理工上万次测试给出详细分析
GPT-4o,比上一代更容易被越狱攻击了?来自北航和南洋理工的研究人员,通过上万次的 API 查询,对 GPT-4o 各种模态的安全性进行了详细测试。结果发现,GPT-4o 新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌 GPT-4V。具体来说,研究人员针对 4 个常用的基准测试,对 GPT-4o 支持的三种模态(文本、图像、音频)进行了测试。测试一共涉及到 4000 初始文本查询的优化,8000 响应判断,16000 次 OpenAI 的 API 查询。基于此,研究人员撰写了详细的报告,给
6/12/2024 3:44:32 PM
清源
谷歌工程师批评 OpenAI,称其延缓 AGI 研究进展
TradingView 报道称,谷歌软件工程师弗朗索瓦・肖莱(François Chollet)在播客与主持人 Dwarkesh Patel 对话时,表达了他对 AGI(通用人工智能,Artificial General Intelligence)研究现状的担忧。肖莱表示,几年前所有最先进的研究成果都是公开分享和发表的,但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响,指责他们导致了“前沿研究出版的完全关闭”(complete closing down of frontier research pu
6/12/2024 3:07:56 PM
沛霖(实习)
拿下 6 亿欧元融资,“OpenAI 欧洲对手”Mistral 估值飙升至近 60 亿欧元
据《金融时报》北京时间今日凌晨报道,总部位于巴黎的 AI 初创公司 Mistral AI 现已筹集到 6 亿欧元的资金,估值接近 60 亿欧元(IT之家备注:当前约 468 亿元人民币)。该公司由微软、英伟达提供支持,成立至今刚满一年,被视作 OpenAI 的“潜在挑战者”。自(去年)12 月以来,对该公司的投资使其估值翻了三倍。Mistral 的首席执行官 Arthur Mensch 在接受采访时表示:“从创业之初,我们就被告知…… 这是一个永远不会被颠覆的市场。但我们证明事实并非如此,我们有效地颠覆了 Open
6/12/2024 2:52:36 PM
清源
消息称 OpenAI 阿尔特曼和三星李在镕首次单独会面,讨论合作 AI 芯片
感谢据《韩国时报》援引知情人士消息,OpenAI CEO 山姆・阿尔特曼近日会见了正在美国出差的三星集团会长李在镕。与此同时,OpenAI 刚刚与苹果签署了合作伙伴关系。报道称,阿尔特曼和李在镕于上周末在硅谷进行了会面,这是双方第一次单独见面。阿尔特曼曾在今年 1 月访问了韩国,并参观了三星电子的半导体工厂。报道提到,双方讨论了人工智能(AI)芯片的合作问题。阿尔特曼正在推动开发自己的 AI 芯片,以减少对英伟达的依赖。三星电子则是具有制造能力的第一大存储半导体公司,被认为是一个强大的关键合作伙伴。如果消息属实,此
6/12/2024 10:22:18 AM
汪淼
预测准确率达95.7%,ChatMOF利用LLM预测和生成金属有机框架
编辑 | X金属有机框架(MOF)因其孔隙率大、表面积大和出色的可调性而用于许多化学应用。然而,在利用 AI 深入探索 MOF 设计与性能优化的研究征途中,科学家们正面临着前所未有的挑战。去年 3 月,韩国科学技术院(Korea Advanced Institute of Science and Technology,KAIST)的研究人员提出的 MOFTransformer 模型经过一百万个假设的 MOF 的预训练,在预测各种属性方面表现出色。近日,KAIST 团队提出了一种 AI 系统——ChatMOF,用于预
6/11/2024 5:09:00 PM
ScienceAI
OpenAI 官宣新任首席财务官、首席产品官,并与苹果达成合作
感谢OpenAI 今日官宣聘请了两名高管,并与苹果建立合作伙伴关系。该公司在博客文章中宣布,Nextdoor 前首席执行官兼 Square 财务总监 Sarah Friar 将加入公司,担任首席财务官(CFO)。Friar 还是斯坦福大学数字经济实验室的联合主席。此外,Kevin Weil 加入 OpenAI 担任首席产品官(CPO)。他将领导一个产品团队,专注于将研究应用于消费者、开发者和企业的产品和服务。他曾经担任 Planet Labs 前总裁、Twitter 产品高级副总裁、Facebook 和 Insta
6/11/2024 12:10:18 PM
汪淼
Copilot Pro 订阅魅力下降,微软 7 月 10 日下线用户自建 GPT 服务
微软今天发布公告,宣布 Copilot Pro 服务将移除 GPT Builder,意味着订阅用户无法继续创建自己的 Copilot GPT。GPT Builder 也称为 Copilot GPT,订阅 Copilot Pro 的用户可以使用文档、外部或内部资源以及自定义指令创建自己的 Copilot GPT。Copilot Pro 是售价 20 美元的 Microsoft Copilot 订阅版本,具有一些附加功能,如 GPT 生成器和 Copilot 在 Word、Excel、PowerPoint 和 Outl
6/11/2024 10:18:46 AM
故渊
不只 ChatGPT,苹果希望将谷歌 Gemini 等其他 AI 模型也添加到 iOS 18 中
在宣布与 OpenAI 旗下的 ChatGPT 达成合作后,苹果软件工程高级副总裁 Craig Fedrighi 在 WWDC24 开发者大会上确认了与其它第三方模型合作的计划。Fedrighi 在主题演讲后的采访中透露:“我们期待在未来与其它 AI 模型集成,例如谷歌的 Gemini。”OpenAI 的 ChatGPT 将在今年晚些时候成为第一个集成至苹果系统的 AI 模型。Fedrighi 特别提到,苹果希望最终让用户在不同的 AI 大模型之间进行选择,从而与 Apple Intelligence 一起使用。而
6/11/2024 7:27:33 AM
汪淼
Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定
这是Karpathy「Neural Networks:zero to hero」系列视频的最新内容。AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。视频主题为「让我们来复现 GPT-2(1.24 亿参数)」。Karpathy 表示,此次视频之所以这么长,是因为它很全面:从空文件开始,最后得到一个 GPT-2(124M)模型。具体实现步骤包括如下:首先构建 GPT-2 网络。然后对其进行优化,以便快速训练。然后通过参考 GPT-2 和 GPT-3 论文来设置训练运行优化和
6/11/2024 12:57:00 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉