人工智能

全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹

全球首个端侧全模态理解开源模型来了！在菜单里帮忙选奶茶，不在话下：还能帮忙轻松提炼长语音，再也不用对着一串几十秒语音头皮发麻（doge）。就在刚刚，无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni，不仅体积轻巧，速度飞快，更是一个多才多艺的全能选手，能够轻松处理图片、音频、文本三种模态数据。

12/16/2024 4:10:15 PM

Scaling Law不总是适用！尤其在文本分类任务中，vivo AI Lab提出数据质量提升解决方法

Scaling Law不仅在放缓，而且不一定总是适用！尤其在文本分类任务中，扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。要是类别界限不够清晰，数据冲突现象就更明显了。

12/16/2024 7:20:00 AM

OpenAI附议Ilya预训练终结！“但Scaling Law还没死”

在Ilya探讨完「预训练即将终结」之后，关于Scaling Law的讨论再次引发热议。这届NeurIPS将被铭记成预训练终结的一届会议。在最新研讨会上，OpenAI大神，o1核心成员Noam Brown表示，o1代表的是一种全新的，以推理计算为代表的Scaling。

12/16/2024 7:15:00 AM

Ilya Sutskever在NeurIPS炸裂宣判：预训练将结束，数据压榨到头了

「推理是不可预测的，所以我们必须从令人难以置信的，不可预测的 AI 系统开始。」Ilya 终于现身了，而且一上来就有惊人之语。本周五，OpenAI 的前首席科学家 Ilya Sutskever 在全球 AI 顶会上表示：「我们能获得的数据已经到头，不会再有更多了。

12/16/2024 7:10:00 AM

Claude 3.5 编程收入暴增 10 倍，抢走 Cursor 反杀 OpenAI

成立仅三年，估值 180 亿美金 Anthropic 正义迅雷不及掩耳之势，一步步蚕食 OpenAI 市场份额。在过去 3 个月，他们编程收入暴增 10 倍，还抢走了最火的 Cursor，OpenAI 的高管们彻底坐不住了！

12/15/2024 1:14:41 PM

远洋

阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”

Step-1o 支持语音、文本等混合形式的输入和输出，可以快速反应并随时打断，它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。

12/14/2024 5:44:41 PM

浩渺

26 岁 OpenAI“吹哨人”Suchir Balaji 自杀身亡，曾质疑 ChatGPT 版权问题

据《印度快报》今日报道，印度裔美国人、前 OpenAI 研究员 Suchir Balaji 于 11 月 26 日在旧金山的公寓中去世，法医判定死因自杀，未发现外部侵害迹象。

12/14/2024 2:02:35 PM

清源

OpenAI 联合创始人 Ilya Sutskever 谈“超智能 AI”：将具备推理能力，会更加不可预测

他表示，超智能 AI 系统将真正具备 AI 智能体的特性，而非当前我们所说的“仅有微弱代理特征”的 AI。它们将具备推理能力，因此变得更加不可预测。

12/14/2024 9:44:44 AM

清源

为什么ETL和AI不是竞争对手，而是数据未来的合作伙伴

译者 | 晶颜审校 | 重楼去年，大模型经历了爆炸式增长，进一步完善了人工智能解决问题的能力。今年，随着炒作的热度消退，大模型进入了更深层次的阶段，旨在重塑各行业的基础逻辑。在大数据处理中，大模型与传统ETL （即提取Extract、转换Transform、加载Load）过程之间的冲突引发了新的争论。

12/13/2024 8:00:00 AM

晶颜

专治大模型“套壳”！上海AI实验室等给LLM做“指纹识别”，模型剪枝、合并等也无所遁形

大模型“套壳”事件防不胜防，有没有方法可以检测套壳行为呢？来自上海AI实验室、中科院、人大和上交大的学者们，提出了一种大模型的“指纹识别”方法——REEF（Representation Encoding Fingerprints）。在不改变模型性能的前提下，利用REEF就可以精准识别未经授权的后续开发行为。

12/13/2024 7:39:22 AM

谷歌测试 Gemini AI 游戏助手：实时分析屏幕以提供游戏建议

谷歌今日发布了 Gemini 2.0，并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则，从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示，这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理，并通过实时对话为玩家提供后续操作建议。”他们还提到，这些助手还可以“利用谷歌搜索，将玩家与网络上丰富的游戏知识连接起来。”

12/12/2024 9:02:04 AM

远洋

YouTube 自动配音功能推广至更多知识类频道，借助 AI 生成视频多语言配音

YouTube当地时间周二宣布，其自动配音功能已开始推广至更多的频道，创作者可为其视频生成多种语言的翻译音频。此前，这项功能仅限于少数创作者进行测试。

12/11/2024 11:21:50 AM

清源

OpenAI 首席财务官：向企业收取每月数千美元订阅费是合理的，能更好体现技术价值

据彭博社报道，OpenAI 首席财务官 Sarah Friar 表示，为其AI软件向企业用户每月收取数千美元的费用是合理的，因为这能更好地体现技术为企业提供的价值。

12/11/2024 8:21:12 AM

清源

Sora开服被挤爆！支持中文/编剧模式/作品分享，145块就能玩

传言为真，Sora开放！ OpenAI“双十二”第三天，更重磅炸弹来袭——只要是ChatGPT Plus/Pro用户，就能直接用Sora生成视频。场面有多火爆呢？

12/10/2024 8:17:49 AM

Scaling Law不是唯一视角！清华刘知远团队提出大模型“密度定律”：模型能力密度100天翻番

Scaling Law并非描述大模型能力的唯一视角！清华NLP实验室刘知远教授团队，最新提出大模型的密度定律（densing law），表达形式让人想到芯片领域的摩尔定律：模型能力密度随时间呈指数级增长，2023年以来能力密度约每3.3个月（约100天）翻一倍。根据密度定律，研究团队还得出以下重要推论——AI时代的三大核心引擎——电力、算力与智力，都同样遵循密度快速增长趋势。

12/10/2024 7:00:00 AM