AIGC宇宙 AIGC宇宙

大模型

南大周志华:百万模型进入学件基座系统,很多我们没预期过的事也有可能实现 | MEET 2025

大模型时代,全世界AI从业者追赶OpenAI GPT系列的脚步仍未停歇,但也有人,坚持深耕在国产原创的另一条大模型之路上。 南京大学副校长、国际人工智能联合会理事会主席周志华教授,就是其中代表。 他提出的“学件范式”,旨在从数据隐私角度着手,通过模型 规约的方式构建基座系统,让用户的需求能被自动匹配到合适的模型、模型组合上,安全、可靠地复用他人开发的模型工具。
12/30/2024 12:30:00 PM
量子位

央视《对话》直击百度吴甜谈大模型产业落地​

2024年,关于大模型的讨论从未停歇,国内大模型市场进入到新阶段,大模型落地情况到底如何? AI 应用有哪些新场景、新变化? 近日,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目,从技术发展及产业实践角度分享了当前以大模型为代表的人工智能技术发展及产业应用的最新进展。
12/30/2024 11:57:33 AM

低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws

论文标题:Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens论文链接:(low-bit quantization)和低比特大语言模型(low-bit LLM)近期受到了广泛的关注,因为有一些研究发现,它们能够以更小的模型规模、更低的内存占用和更少的计算资源,取得与 fp16 或 bf16 精度相当的性能表现。 这一发现让低比特语言模型一度被认为是实现模型高效化的一个非常有前景的方向。 然而,这一观点受到了腾讯 AI Lab 的挑战。
12/30/2024 10:35:00 AM
机器之心

机器人空间泛化也有Scaling Law!清华新国大新算法框架让机器人操作更加鲁棒

在机器人空间泛化领域,原来也有一套Scaling Law! 来自清华和新加坡国立大学的团队,发现了空间智能的泛化性规律。 在此基础上,他们提出了一套新颖的算法框架——ManiBox,让机器人能够在真实世界中应对多样化的物体位置和复杂的场景布置。
12/30/2024 10:20:00 AM
量子位

2024年优秀Web开发工具发展趋势总结

译者 | 陈峻审校 | 重楼在科技领域我们经常会看到,某一项技术的兴起和受到关注,往往会为其他相关领域的蓬勃发展创造广阔的空间和资源。 例如,在大量涌现的LLM(大语言模型)领域,入场的玩家和资本产生了蝴蝶效应,为其他技术稍逊、但小众必要的软件项目,提供了更多的发展可能性与应用空间。 它们虽然并不处在技术迭代的第一线,但是确实能让项目本身、以及用户从中受益。
12/30/2024 10:14:13 AM
陈峻

OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

随着AI不断刷新各项基准测试,关于AI的发展各方也态度不一。 早在本月5日,「泛化的未知未来」研讨会上,众多知名研究员就相关话题展开了一场针锋相对的辩论。 此次辩题是 「当今的LLM沿着既有路线持续发展是否就足以实现真正的AGI」。
12/30/2024 9:30:00 AM
新智元

DeepSeek V3“报错家门”:我是ChatGPT

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。 不过在网友们纷纷测试之际,有个bug也成了热议的焦点——只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。 甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。
12/30/2024 9:25:00 AM
量子位

超越ControlNet++!腾讯优图提出动态条件选择新架构

超越ControlNet ,让文生图更可控的新框架来了! 腾讯优图、南洋理工、浙大等研究机构联合推出DynamicControl,直接将多模态大语言模型(MLLM)的推理能力集成到文本生成图像(T2I))任务中。 而且还提出了一种新颖、高效的多控制适配器,可以自适应地选择不同的条件,从而实现动态多控制对齐。
12/30/2024 8:50:00 AM
量子位

基于指标+标签的经营分析 Agent 创新实践

数势科技研发的数据资产和数据分析相关产品,主要面向零售和金融企业,帮助其进行业务语义层资产构建,为企业提供基于大模型增强的数据分析 AI Agent、智能指标平台、智能标签平台及智能营销平台,从而助力企业提升数字化决策能力,推动企业数字化升级。 本文将分享如何基于大模型能力,叠加指标和标签平台能力,构建企业内智能数据分析产品。 一、企业经营分析的难点和挑战企业内部的数据分析涉及到诸多方面,包括:加工制作报表;基于数据发现异常因素,开发人员需要通过 SQL 或算法去做多维异常检测;进一步挖掘异常背后的原因,又需要因果推断或者归因洞察等算法;分析之后还需要撰写数据分析报告。
12/30/2024 8:45:09 AM
李飞

基于谷歌Gemini多模态模型实现PDF文档自动化处理

译者 | 朱先忠审校 | 重楼引言近年来,自动化文档处理成为ChatGPT革命的最大赢家之一,因为LLM能够在零样本设置中处理广泛的主题和任务,这意味着无需域内标记的训练数据。 这使得构建AI驱动的应用程序来处理、解析和自动理解任意文档变得更加容易。 虽然使用LLM的简单方法仍然受到非文本上下文(例如图形、图像和表格)的阻碍,但是这正是我们将在本文中尝试解决的问题,而且我们特别关注PDF文件格式。
12/30/2024 8:33:54 AM
朱先忠

CPO薪资倒挂CEO,创业公司薪酬情况大起底

初创公司里,平均薪酬最高的不是CEO? 你还真别说,事实上,CEO薪酬不仅远远落后CPO(首席产品官,Chief Product Officer)。 甚至COO(首席运营官,Chief Operating Officer)、CTO(首席技术官,Chief Technology Officer)都比CEO要高。
12/30/2024 8:10:00 AM
量子位

中科院海洋所发布高分辨率海洋大模型“琅琊”1.0 ,可提升全球海洋预报准确性

“琅琊”由中国科学院海洋研究所自主研发,是面向海洋状态变量预报研发的新一代人工智能大模型。
12/28/2024 3:38:40 PM
清源

谷歌 CEO 皮查伊:明年风险高、赌注大,推广 Gemini 是首要任务

皮查伊表示,“我认为2025年将是关键的一年。我们需要深刻认识到当前的紧迫性,并加快公司步伐。这是一个具有颠覆性影响的时刻,我们必须专注于推动技术带来的变革,解决用户的实际问题。”
12/28/2024 12:32:03 PM
清源

火山引擎视觉大模型4K修复百部港片,面部肤质纹理等细节更清晰

12月26日-29日,“经典香港电影修复计划” 专题展在京举办。 该修复计划由中国电影资料馆、抖音、火山引擎发起,历经一年多时间,完成100部港片的4K修复工作。 其中10部是“人工 AI”精修,90部主要由AI修复,这些修复后的作品已上线抖音、抖音精选,搜索片名即可观看。
12/27/2024 9:27:00 PM
新闻助手

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。 怎么说呢,QLoRA一作的一个词评价就是:优雅。
12/27/2024 12:37:18 PM
量子位

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。 它重点关注了AI视频编辑中最常见的一个场景:视频编辑前后结果与原始视频之间的联系。
12/27/2024 12:36:27 PM
量子位

中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元

一夜之间,来自中国的大模型刷屏全网。 DeepSeek-V3,一个拥有671B参数的MoE模型,吞吐量每秒高达60 token,比上一代V2直接飙升3倍。 在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。
12/27/2024 10:27:58 AM
新智元

Cursor 深度评测:革命性提效工具还是过誉的玩具?

最近 Cursor 很火,火到我身边的程序员们已经不聊河北彩花,LOL,黑猴等,而是在各种场合讨论这个 Cursor 的辅助编程能力。 各类内容平台也在以惊人的速度,迭代出了许多相关教学视频:图片我试用了一段时间,第一感觉确实很惊艳,能帮我解决很多基础问题,实打实地提升开发效率,印象比较深的,包括:Codebase Indexing、@symbol 等功能带来的更强的上下文索引能力,而这极大提升最终 LLM 生成的代码效果;Cursor Composer 功能提供了一个注意力非常聚焦的编程面板,相比于过往 GPT 等产品的即聊即抛的模式,更容易做好跨文件的编辑开发,而这更符合专业开发者的模块化编程习惯。 但是,我觉得,至少在当下阶段,这类产品的定位只能是“辅助编程”,虽然能极大提升效率,但还只是编程活动中的辅助客体,俗称打下手;程序员本体 —— 人类智能依然是主体地位,有点类似于掌柜的吧。
12/27/2024 9:05:18 AM
范文杰