大模型

AI能力权威认证！用友大易入选最佳大模型产品及应用TOP20

近日，「AI中国」AI在线2024年度榜单正式揭晓，基于YonGPT用友企业服务大模型的AI招聘系统成功上榜「最佳大模型产品及应用TOP20」。用友大易依托于YonGPT的强大功能，探索并实现AI技术在招聘方面的深度应用和商业价值，助力企业实现招聘的提效增质。凭借其突出的创新性和实用性荣获「最佳大模型产品及应用TOP20」奖项。

12/31/2024 11:32:00 AM

新闻助手

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。传统银行客户服务依赖专业的人工客服，虽然能提供较高的情感交互，但因响应时间较长、服务覆盖面有限以及成本较高，难以满足现代客户对高效、便捷服务的需求。

12/31/2024 8:46:28 AM

王涛刘丁

减少LLM幻觉的五大技巧和方法

译者 | 布加迪审校 | 重楼本文介绍了使用LangGraph减少LLM幻觉的简单技巧。如果你使用过LLM，就知道它们有时会产生幻觉。这意味着它们生成的文本要么毫无意义，要么与输入数据相矛盾。

12/31/2024 8:03:12 AM

布加迪

DeepSeek的V3，爆火了

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）上周四，12月26日那个晚上非常不平凡，一件大事注定要被AI界写进里程碑。一夜之间，全球开源界最强模型不再是Llama了，而是中国开源界的新星DeepSeek最新研发的前言模型V3，甚至可以比肩世界顶尖的闭源模型。根据DeeSeek披露的基准测试分数，简单来讲，八个字：开源最强，闭源比肩。

12/30/2024 8:32:36 PM

言征

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。

12/30/2024 5:03:59 PM

浩渺

沙利文发布权威报告：商汤科技GenAI技术栈市场综合能力位居国内第一

创新实力强、应用落地广，GenAI（生成式AI）技术栈领域，商汤科技位居国内榜首！近日，权威研究机构弗若斯特沙利文（Frost & Sullivan, 简称“沙利文”）联合头豹研究院发布《2024年中国GenAI技术栈市场报告》，商汤科技在11个GenAI厂商中超越阿里云、百度智能云和华为云，增长指数和创新指数均排名国内第一，在全球排名中仅次于亚马逊云科技。报告认为，商汤积极投入技术创新，致力于为用户提供行业领先的自研模型与高性能国产化的推理引擎，同时建立了包含机器与人工审核、安全评测与内容安全策略迭代升级等在内的完整性安全管理方案，是GenAI技术栈领域的领导者。

12/30/2024 4:09:00 PM

新闻助手

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

暨南大学通用机器学习课题组由网络空间安全学院和信息科学技术学院的多名青年教师、博士生、硕士生和本科生共同组成，研究方向包括通用逼近理论、分布外泛化、非凸优化、稀疏学习、深度学习框架的基础模块开发、优化器开发、隐私保护与增强等。自 2024 年 4 月至 12 月，课题组作为第一单位已获得所有 CCF A 机器学习国际顶级会议 ICML（2 篇）、NeurIPS 和人工智能国际顶级会议 IJCAI、AAAI 录用论文共 5 篇。本文第一作者为课题组负责人赖兆荣，通讯作者为博士生李程，其他合作作者为课题组教师吴小天、方良达、陈子良。

12/30/2024 2:00:00 PM

机器之心

港科大开源VideoVAE+，视频重建质量全面超越最新模型

港科大团队重磅开源 VideoVAE ，提出了一种强大的跨模态的视频变分自编码器（Video VAE），通过提出新的时空分离的压缩机制和创新性引入文本指导，实现了对大幅运动视频的高效压缩与精准重建，同时保持很好的时间一致性和运动恢复。论文地址：：模型大幅超过最新模型包括英伟达在 2024.11 发布的 Cosmos Tokenizer，同时也超越一众方法包括腾讯在 2024.12 发布的 Hunyuan Video，CogvideoX VAE，WF-VAE，CV-VAE，Open Sora，Open Sora Plan, Easy Animate-VAE。什么是 VideoVAE 模型VideoVAE 模型（Video Variational Autoencoder）是一种基于深度学习的生成模型，用于对视频数据进行压缩、重建和生成，讲视频从 RGB 像素空间投影到低维度的 latent 空间。

12/30/2024 1:40:00 PM

机器之心

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

让 Llama 2 在 Windows 98 奔腾 2（Pentium II）机器上运行，不但成功了，输出达到 39.31 tok / 秒。这台 PC 可能比你的年龄还大，要知道它已经是 26 年前的硬件了，配备英特尔奔腾 2 CPU 和 128MB 的内存。该项目是一个名为 EXO Labs 组织的一次大胆尝试，其证明了如果 Llama 模型能在 26 年前的硬件上跑通，那么它可以在任何地方运行。

12/30/2024 12:35:24 PM

机器之心

南大周志华：百万模型进入学件基座系统，很多我们没预期过的事也有可能实现 | MEET 2025

大模型时代，全世界AI从业者追赶OpenAI GPT系列的脚步仍未停歇，但也有人，坚持深耕在国产原创的另一条大模型之路上。南京大学副校长、国际人工智能联合会理事会主席周志华教授，就是其中代表。他提出的“学件范式”，旨在从数据隐私角度着手，通过模型规约的方式构建基座系统，让用户的需求能被自动匹配到合适的模型、模型组合上，安全、可靠地复用他人开发的模型工具。

12/30/2024 12:30:00 PM

量子位

央视《对话》直击百度吴甜谈大模型产业落地

2024年，关于大模型的讨论从未停歇，国内大模型市场进入到新阶段，大模型落地情况到底如何？ AI 应用有哪些新场景、新变化？近日，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目，从技术发展及产业实践角度分享了当前以大模型为代表的人工智能技术发展及产业应用的最新进展。

12/30/2024 11:57:33 AM

低精度只适用于未充分训练的LLM？腾讯提出LLM量化的scaling laws

论文标题：Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens论文链接：（low-bit quantization）和低比特大语言模型（low-bit LLM）近期受到了广泛的关注，因为有一些研究发现，它们能够以更小的模型规模、更低的内存占用和更少的计算资源，取得与 fp16 或 bf16 精度相当的性能表现。这一发现让低比特语言模型一度被认为是实现模型高效化的一个非常有前景的方向。然而，这一观点受到了腾讯 AI Lab 的挑战。

12/30/2024 10:35:00 AM

机器之心

机器人空间泛化也有Scaling Law！清华新国大新算法框架让机器人操作更加鲁棒

在机器人空间泛化领域，原来也有一套Scaling Law！来自清华和新加坡国立大学的团队，发现了空间智能的泛化性规律。在此基础上，他们提出了一套新颖的算法框架——ManiBox，让机器人能够在真实世界中应对多样化的物体位置和复杂的场景布置。

12/30/2024 10:20:00 AM

量子位

2024年优秀Web开发工具发展趋势总结

译者 | 陈峻审校 | 重楼在科技领域我们经常会看到，某一项技术的兴起和受到关注，往往会为其他相关领域的蓬勃发展创造广阔的空间和资源。例如，在大量涌现的LLM（大语言模型）领域，入场的玩家和资本产生了蝴蝶效应，为其他技术稍逊、但小众必要的软件项目，提供了更多的发展可能性与应用空间。它们虽然并不处在技术迭代的第一线，但是确实能让项目本身、以及用户从中受益。

12/30/2024 10:14:13 AM

陈峻

OpenAI研究员首次提出「AGI时间」进化论！o1数学已达「分钟级AGI」

随着AI不断刷新各项基准测试，关于AI的发展各方也态度不一。早在本月5日，「泛化的未知未来」研讨会上，众多知名研究员就相关话题展开了一场针锋相对的辩论。此次辩题是「当今的LLM沿着既有路线持续发展是否就足以实现真正的AGI」。

12/30/2024 9:30:00 AM

新智元

DeepSeek V3“报错家门”：我是ChatGPT

要说这两天大模型圈的顶流话题，那绝对是非DeepSeek V3莫属了。不过在网友们纷纷测试之际，有个bug也成了热议的焦点——只是少了一个问号，DeepSeek V3竟然称自己是ChatGPT。甚至让它讲个笑话，生成的结果也是跟ChatGPT一样：加之DeepSeek V3这次爆火的一个亮点，就是训练只花了557.6万美元的成本。

12/30/2024 9:25:00 AM

量子位

超越ControlNet++！腾讯优图提出动态条件选择新架构

超越ControlNet ，让文生图更可控的新框架来了！腾讯优图、南洋理工、浙大等研究机构联合推出DynamicControl，直接将多模态大语言模型（MLLM）的推理能力集成到文本生成图像（T2I)）任务中。而且还提出了一种新颖、高效的多控制适配器，可以自适应地选择不同的条件，从而实现动态多控制对齐。

12/30/2024 8:50:00 AM

量子位

基于指标+标签的经营分析 Agent 创新实践

数势科技研发的数据资产和数据分析相关产品，主要面向零售和金融企业，帮助其进行业务语义层资产构建，为企业提供基于大模型增强的数据分析 AI Agent、智能指标平台、智能标签平台及智能营销平台，从而助力企业提升数字化决策能力，推动企业数字化升级。本文将分享如何基于大模型能力，叠加指标和标签平台能力，构建企业内智能数据分析产品。一、企业经营分析的难点和挑战企业内部的数据分析涉及到诸多方面，包括：加工制作报表；基于数据发现异常因素，开发人员需要通过 SQL 或算法去做多维异常检测；进一步挖掘异常背后的原因，又需要因果推断或者归因洞察等算法；分析之后还需要撰写数据分析报告。

12/30/2024 8:45:09 AM

李飞

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线东风日产N7首款接入DeepSeek大模型，实现智能化人机交互腾讯云上线DeepSeek全系API接口并打通联网搜索微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测

大模型

AI能力权威认证！用友大易入选最佳大模型产品及应用TOP20

G行人工智能与大模型技术的应用与发展

减少LLM幻觉的五大技巧和方法

DeepSeek的V3，爆火了

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

沙利文发布权威报告：商汤科技GenAI技术栈市场综合能力位居国内第一

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

港科大开源VideoVAE+，视频重建质量全面超越最新模型

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

南大周志华：百万模型进入学件基座系统，很多我们没预期过的事也有可能实现 | MEET 2025

央视《对话》直击百度吴甜谈大模型产业落地​

低精度只适用于未充分训练的LLM？腾讯提出LLM量化的scaling laws

机器人空间泛化也有Scaling Law！清华新国大新算法框架让机器人操作更加鲁棒

2024年优秀Web开发工具发展趋势总结

OpenAI研究员首次提出「AGI时间」进化论！o1数学已达「分钟级AGI」

DeepSeek V3“报错家门”：我是ChatGPT

超越ControlNet++！腾讯优图提出动态条件选择新架构

基于指标+标签的经营分析 Agent 创新实践

央视《对话》直击百度吴甜谈大模型产业落地