文章列表
斯坦福大模型评测榜 Claude 3 排名第一,阿里 Qwen2、零一万物 Yi Large 国产模型进入前十
斯坦福大学基础模型研究中心(CRFM)6 月 11 日发布了大规模多任务语言理解能力评估(Massive Multitask Language Understanding on HELM)排行榜,其中综合排名前十的大语言模型中有两款来自中国厂商,分别是阿里巴巴的 Qwen2 Instruct(72B)和零一万物的 Yi Large(Preview)。据悉大规模多任务语言理解能力评估(MMLU on HELM)采用了 Dan Hendrycks 等人提出的一种测试方法,用于衡量文本模型在多任务学习中的准确性。这个测试
6/22/2024 8:17:14 PM
满河(实习)
生成式 AI“上车”,大众高尔夫、途观、帕萨特等海外版车型现已支持 ChatGPT
当地时间 21 日,大众汽车宣布配备新一代信息娱乐系统的车型现已加入对 ChatGPT 的支持。在欧洲地区,引入 ChatGPT 的车型包括纯电动 ID.系列、新款高尔夫、新款途观、新款帕萨特,用户可通过车辆内置 IDA 语音助手访问 ChatGPT。据介绍,AI“上车”之后带来的体验远远超出以往,用户可以要求汽车直接读出搜索结果,或使用自然语言与汽车进行交互。例如,接入 ChatGPT 的车机可以提供旅游景点信息、报道过去的足球比赛或帮助解决数学问题。驾驶员只需用自然语言与助手交谈,无需将视线从道路上移开。与现有
6/22/2024 12:05:43 PM
清源
有望发力搜索领域,OpenAI 收购数据库分析公司 Rockset
当地时间 6 月 21 日,OpenAI 宣布完成了对数据库检索和分析公司 Rockset 的收购。公司将整合 Rockset 的技术和人员,强化各项产品的检索基础设施。OpenAI 在新闻稿中强调,AI 将有机会改变人们组织、利用自身数据的方式,这便是公司收购 Rockset 的原因。后者是一个提供“世界级”的数据索引、查询功能的实时分析数据库。据悉,Rockset 将使用户、开发人员和企业能够更好地利用自己的数据,并在使用 AI 产品和构建更智能的应用程序时访问实时信息。OpenAI 首席运营官 Brad Li
6/22/2024 9:33:34 AM
清源
OpenAI 首席技术官:GPT-5 将在一年半后发布,部分领域智能达到“博士”级别
美国达特茅斯工程学院本周四公布了对 OpenAI 首席技术官米拉・穆拉蒂的采访。穆拉蒂把 GPT-4 到 GPT-5 的飞跃描述为从高中生到博士生的成长。图源 Pexels“如果你看一下(GPT)进化的轨迹,像 GPT-3 这样的系统可能只有幼儿智力水平,而像 GPT-4 这样的系统则更像是聪明的高中生智力水平,在接下来的几年里,我们期待在特定任务上达到博士的智力水平。事情正在飞速变化、改善。”穆拉蒂强调“博士级”的智能仅适用于某些任务。“这些系统在特定任务中已经达到了人类水平(Human-level),当然,在许
6/22/2024 8:20:43 AM
清源
8500字干货!生成式AI助手设计指南(上篇)
一、前言
自 2022 年 11 月 ChatGPT 横空出世以来,世界好像被颠覆了。各类生成式 AI 迅猛发展,其中生成式 AI 助手以其独特的创造力和智能性,重新定义了许多产品的使用方式。它通过先进的自然语言处理技术,不仅能理解用户的指令和问题,还能生成回答、撰写文本、甚至创作内容,拓展了人机交互的边界,带给人们极大的便利。
全球的技术巨头和创新型初创公司都纷纷投身于生成式 AI 这一必争之地,各大厂商都在积极探索如何将生成式 AI 助手融入到自己的产品和服务中。
本文将从 UX 设计的角度,拆解生成式 AI
6/22/2024 3:13:52 AM
团队58UXD
一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?
机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude 3.5能力真那么玄乎?它来了,它来了,它带着 Claude 3.5 Sonnet 走来了!蛰伏三个月,就在昨晚,OpenAI 的「劲敌」Anthropic 上新了,推出新一代模型 ——Claude 3.5 Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解、数学、科学和
6/21/2024 6:02:00 PM
机器之能
ComfyUI 插件竟然包含病毒!做好这 5 点降低中招风险
大家好,这里是和你们一起探索 AI 的花生~
ComfyUI 是目前最受欢迎的开源 AI 绘画绘画工具之一,它具有极高的灵活性,只需安装对应的插件就可以自己搭建工作流,实现个性化出图或体验最新的 AI 模型。如果你是 ComfyUI 的深度用户,那么安装各类插件肯定是家常便饭了,不过最近出现的一起 ComfyUI 插件包含恶意病毒的事件,却让我们看到了开源社区自由繁荣背后的另一面,如果不提高防范意识,下一个受害的很可能就是我们自己。
相关推荐:一、病毒插件 ComfyUI_LLMVISION
事情的起因是网友 @_
6/21/2024 8:01:31 AM
夏花生
OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5
感谢IT之家网友 VrianCao、Diixx、我抢了台 的线索投递!OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样,Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立,赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里,Anthropic 完成了五笔融资,总额约为 73 亿美元。今年 3 月,Anthropic 推出了
6/20/2024 11:30:35 PM
-
突发!Ilya Sutskever成立新公司SSI,安全超级智能是唯一目标与产品
自 5 月 15 日从 OpenAI 离职后,OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨,Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」(Safe SuperIntelligence,SSI)。该公司的目标和产品非常明确、单一:追求安全的超级智能,希望通过一支精干顶尖的小团队取得革命性的成果,进而实现这一目标。以下是 SSI 公司的公告:超级智能已经触手可及。构建安全超级智能(SSI)是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S
6/20/2024 2:48:00 PM
机器之心
上海人工智能实验室发布首个 AI 高考评测结果:语数英总分最高 303 分,数学全部不及格
感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍,2024 年全国高考甫一结束,该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。该机构表示,Qwen2-72B、GPT-4o 及书生・浦语 2.0 文曲星(InternLM2-20B-WQX)成为本次大模型高考的前三甲
6/20/2024 8:33:50 AM
清源
Runway 王者归来!发布新模型 Gen-3 Alpha,直接对标 Sora
大家好,这里是和你们一起探索 AI 的花生。
自 OpenAI 发布 Sora,将文生视频拉高到一个新的高度后,各家 AI 视频工具都在努力升级模型、添加新功能,以期在这场竞赛中保住自己的一席之地,比如 Pika 已经推出了风格选择、视频配音、唇形一致等多种功能,Vidu、Kling 则是类 Sora 的新模型,在生成效果上已经十分接近 Sora。而曾经的领军产品 Runway 却始终都没有什么动静,因此很多人都在担心它未来的发展。
最近 Runway 终于放出大招,发布了第三代模型 Gen-3 Alpha,它各方
6/20/2024 8:25:46 AM
夏花生
OpenAI“宫斗”核心人物 Ilya Sutskever 出走后单飞:建立“全球首个”安全超级智能实验室
北京时间今天凌晨,原 OpenAI 公司联合创始人、首席科学家 Ilya Sutskever 在 X(推特)官宣了他正式创业的消息 —— 创办了一家名为“安全超级智能”(Safe Superintelligence,简称 SSI)的新公司,旨在创造一个“纯粹的”安全超级智能。Ilya Sutskever 表示,公司将只有一个重点、一个目标和一个产品,通过一个小型破解团队来取得“革命性”的突破,去实现追求安全超级智能的目标。同时,新公司自称是“世界上第一个”直击 SSI 的实验室。Sutskever 与 OpenAI
6/20/2024 7:18:13 AM
清源
Apple AI 技术的到来,会对设计师产生哪些影响?
期待大半年!Apple Intelligence 终于交卷啦。事件本身热点也许已经过去,但对于设计师而言,一切只是刚刚开始。Apple AI 技术带来的机遇和挑战:
一方面,技术可能会带来一些新的设计工具和技术、设计思路的改变。另一方面,Apple AI 技术也可能会对设计师的工作产生一些挑战,需要提升自身技能点、创造力、甚至是设计思维的迭代。本文涵盖了 Apple AI 对交互界面设计领域的影响,为设计师提供一些不同的视角。密切关注技术的发展,愿自己身处于时代快速变化的洪流之中立于不败之地。
人机交互的创新与机遇
6/20/2024 12:02:08 AM
Monster
AI在用 | AI文风测试火了,林夕的词风竟像大冰,网友:悬着的心终于死了
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。这年头,AI 创业,还得拼脑洞。最近,一个名为「文风测试」的 AI 应用在小红书上火了。用户只需上传一段文字,AI 就能检测出文风像谁。网友们玩得不亦乐乎,纷纷在小红书上 po 出图片。文风有像胡适、鲁迅、顾城、史铁生的,还有像乔
6/19/2024 7:00:00 PM
机器之能
智源更新大模型排行榜:豆包大模型“客观评测”排名国产第一
6月中旬,智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4 以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.96分排名第二,同时也是得分最高的国产大模型;其后依次是 ERNIE 4.0、Baichuan3、Moonshot-v1。在开放问答等“主观评测”中,Doubao-Pro 同样排名第二,得分超过 GPT-4o 和 GPT-4。图:豆包大模型在 FlagEval 客观评测中获综合评分第二(2024年6月)FlagEval 大
6/19/2024 9:30:00 AM
新闻助手
SD超详细教程!AI创意字体海报设计完整思路
一、前言
当夏至晨曦轻抚池塘,垂钓者的悠闲与水中生灵的欢腾交织成章,一幕幕夏日风情画缓缓展开,唤醒心底那份久违的宁静与欢愉。本文聚焦如何用 SD WebUI 巧制夏至字体海报,实战案例解锁设计思路。文中品牌 IP 亮相,纯属友情客串,无任何商业意图。话不多说,直奔主题,满满的设计思路全部奉上,评论区已备好,期待你的独到见解!
二、设计思路
1. 制作字体形状
画图软件新建画布;绘制字体轮廓,确保位置恰当;保存图像,以备 ControlNet 使用2. 选模型调参数
打开 SD/LibLibAI,选择模型,输入正反向
6/19/2024 6:50:49 AM
金玉珏
AI 教父 Hinton:我支持超级 AI 取代人类
【新智元导读】「AI 教父」Geoffrey Hinton 在最近的采访中表达了自己对 AI 智能的理解 ——LLM 并不是简单的统计模型,已经具备了理解能力。与此同时,网友翻出了去年 12 月的「过期」视频,惊奇地发现 Hinton 早就「叛变」了,竟然对超级 AI 取代人类的未来表示支持。最近,半退休的「AI 教父」Geoffrey Hinton 频频出现在各种采访中,输出他关于 ASI 的各种言论和观点,甚至只是聊点生涯轶事都可以引起网友们的热烈讨论。不到一个月之前,他就揭发了爱徒 Ilya 在暑假受够了炸薯
6/18/2024 12:36:25 PM
汪淼
超强 AI 视频生成模型 Dream Machine 来啦!效果秒杀 Runway,可免费使用
大家好,这里是和你们一起探索 AI 的花生~
最近一款新的 AI 视频生成模型 Dream Machine 爆火出圈,它虽然只能生成 5s 的视频片段,但是在画面清晰度、动态的自然流畅程度、以及对提示词的理解上秒杀了 Runway、Pika 等一众工具,甚至能与 Sora 一较高下,因此得到了很多专业人士的肯定和称赞。今天就为大家详细介绍一下 Dream Machine 的用法和特点。
相关推荐:Dream Machine
官网直达:
Dream Machine 是 Luma AI 新推出的一款视频生成模型,这家
6/18/2024 8:22:38 AM
夏花生