人工智能
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。
12/16/2024 4:10:15 PM
Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法
Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。 要是类别界限不够清晰,数据冲突现象就更明显了。
12/16/2024 7:20:00 AM
OpenAI附议Ilya预训练终结!“但Scaling Law还没死”
在Ilya探讨完「预训练即将终结」之后,关于Scaling Law的讨论再次引发热议。 这届NeurIPS将被铭记成预训练终结的一届会议。 在最新研讨会上,OpenAI大神,o1核心成员Noam Brown表示,o1代表的是一种全新的,以推理计算为代表的Scaling。
12/16/2024 7:15:00 AM
Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了
「推理是不可预测的,所以我们必须从令人难以置信的,不可预测的 AI 系统开始。 」Ilya 终于现身了,而且一上来就有惊人之语。 本周五,OpenAI 的前首席科学家 Ilya Sutskever 在全球 AI 顶会上表示:「我们能获得的数据已经到头,不会再有更多了。
12/16/2024 7:10:00 AM
Claude 3.5 编程收入暴增 10 倍,抢走 Cursor 反杀 OpenAI
成立仅三年,估值 180 亿美金 Anthropic 正义迅雷不及掩耳之势,一步步蚕食 OpenAI 市场份额。在过去 3 个月,他们编程收入暴增 10 倍,还抢走了最火的 Cursor,OpenAI 的高管们彻底坐不住了!
12/15/2024 1:14:41 PM
远洋
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
12/14/2024 5:44:41 PM
浩渺
26 岁 OpenAI“吹哨人”Suchir Balaji 自杀身亡,曾质疑 ChatGPT 版权问题
据《印度快报》今日报道,印度裔美国人、前 OpenAI 研究员 Suchir Balaji 于 11 月 26 日在旧金山的公寓中去世,法医判定死因自杀,未发现外部侵害迹象。
12/14/2024 2:02:35 PM
清源
OpenAI 联合创始人 Ilya Sutskever 谈“超智能 AI”:将具备推理能力,会更加不可预测
他表示,超智能 AI 系统将真正具备 AI 智能体的特性,而非当前我们所说的“仅有微弱代理特征”的 AI。它们将具备推理能力,因此变得更加不可预测。
12/14/2024 9:44:44 AM
清源
为什么ETL和AI不是竞争对手,而是数据未来的合作伙伴
译者 | 晶颜审校 | 重楼去年,大模型经历了爆炸式增长,进一步完善了人工智能解决问题的能力。 今年,随着炒作的热度消退,大模型进入了更深层次的阶段,旨在重塑各行业的基础逻辑。 在大数据处理中,大模型与传统ETL (即提取Extract、转换Transform、加载Load)过程之间的冲突引发了新的争论。
12/13/2024 8:00:00 AM
晶颜
专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形
大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。 在不改变模型性能的前提下,利用REEF就可以精准识别未经授权的后续开发行为。
12/13/2024 7:39:22 AM
谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议
谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”
12/12/2024 9:02:04 AM
远洋
YouTube 自动配音功能推广至更多知识类频道,借助 AI 生成视频多语言配音
YouTube当地时间周二宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。
12/11/2024 11:21:50 AM
清源
OpenAI 首席财务官:向企业收取每月数千美元订阅费是合理的,能更好体现技术价值
据彭博社报道,OpenAI 首席财务官 Sarah Friar 表示,为其AI软件向企业用户每月收取数千美元的费用是合理的,因为这能更好地体现技术为企业提供的价值。
12/11/2024 8:21:12 AM
清源
Sora开服被挤爆!支持中文/编剧模式/作品分享,145块就能玩
传言为真,Sora开放! OpenAI“双十二”第三天,更重磅炸弹来袭——只要是ChatGPT Plus/Pro用户,就能直接用Sora生成视频。 场面有多火爆呢?
12/10/2024 8:17:49 AM
Scaling Law不是唯一视角!清华刘知远团队提出大模型“密度定律”:模型能力密度100天翻番
Scaling Law并非描述大模型能力的唯一视角! 清华NLP实验室刘知远教授团队,最新提出大模型的密度定律(densing law),表达形式让人想到芯片领域的摩尔定律:模型能力密度随时间呈指数级增长,2023年以来能力密度约每3.3个月(约100天)翻一倍。 根据密度定律,研究团队还得出以下重要推论——AI时代的三大核心引擎——电力、算力与智力,都同样遵循密度快速增长趋势。
12/10/2024 7:00:00 AM
微软 AI 掌门人苏莱曼不看好 OpenAI 阿尔特曼对 AGI 的预判:当前硬件无法实现
据 The Verge 今晚报道,微软 AI CEO 穆斯塔法・苏莱曼对 OpenAI CEO 山姆・阿尔特曼的最新表态提出了异议,称当前硬件无法实现 AGI。
12/9/2024 11:42:56 PM
清源
OpenAI 六年元老再发文:全球 AI 狂飙,我们应该拉手刹还是踩油门
前段时间离职后留下公开辞职博客的 OpenAI 六年元老 Miles Brundage 最近再发一文,讨论了一个相当热门但棘手的问题:当今的 AI 发展速度,应该加速、减速还是维持现状?
12/9/2024 2:51:26 PM
清源
OpenAI 宣布与武器制造商合作,内部员工发声反对
在上周三发布的一份联合声明中,OpenAI 与国防科技初创公司 Anduril Industries 共同宣布,双方将建立战略合作伙伴关系,以开发和负责任地部署用于国家安全任务的先进人工智能(AI)解决方案。
12/9/2024 1:53:58 PM
远洋
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊