大模型

OpenAI被曝自研人形机器人，四年前因缺数据解散团队，如今要用机器人数据反哺大模型了

o3之后，OpenAI下一个项目曝光了：人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司，也不只是算法团队搞机器人强化学习。而是自己涉足硬件，研发有双臂、双腿的实体人形机器人。 Information的消息称，两位直接了解这个项目的人透露了这个消息。

12/25/2024 10:58:29 AM

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

据 TechCrunch 获得的内部通信内容显示，参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。

12/25/2024 9:28:55 AM

远洋

时隔6年BERT升级！仅编码器架构没被杀死，更快更准确更长上下文

时隔6年，一度被认为濒死的“BERT”杀回来了——更现代的ModernBERT问世，更快、更准、上下文更长，发布即开源！去年一张“大语言模型进化树”动图在学术圈疯转，decoder-only枝繁叶茂，而曾经盛极一时的encoder-only却似乎走向没落。 ModernBERT作者Jeremy Howard却说：encoder-only被低估了。

12/24/2024 3:30:00 PM

量子位

OpenAI被曝数据崩溃GPT-5难产，团队抢算力冲突激烈！Ilya预言成真？

OpenAI轰轰烈烈搞出一场12天圣诞特别活动，结果期间发布最轰动成果的，居然是谷歌。谷歌一发发密集的核弹，让OpenAI分成12天的挤牙膏黯然失色，毫无还手之力。原生多模态Gemini 2.0 Flash，demo惊艳的Project Astra，组团出道的AI智能体，效果吊打Sora掀起全网狂潮的Veo 2……显得OpenAI的圣诞活动仿佛是个笑话。

12/24/2024 2:30:00 PM

新智元

近1.4万星，腾讯混元大模型开源成绩单公布，多次登顶开源趋势热榜

记者获悉，腾讯云副总裁，腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示，腾讯将开源协同作为公司的核心技术战略，积极推动内外部技术开源共享。腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源，未来大模型各版本也将进一步开源，与社区开发者一起共同推动技术生态繁荣发展。（腾讯云副总裁，腾讯混元大模型负责人刘煜宏）腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态，是开源系列模型中较全的，其模型性能也得到了开源社区的高度认可，总GitHub Star（星星）数量近1.4万颗，并且多次登顶趋势榜。

12/24/2024 11:17:00 AM

新闻助手

使用LLaMA 3.1、Firebase和Node.js，构建一个音控的智能厨房应用程序

译者 | 布加迪审校 | 重楼这篇指南逐步介绍了创建一个自动化的厨房助理的过程，附有语音命令、实时购物清单管理以及食谱建议。我在本教程中将介绍创建一个智能厨房应用程序（Chent），它可以根据个性化偏好简化杂货清单管理。该应用程序通过语音命令操作，简化了人机交互和添加商品。

12/24/2024 8:12:59 AM

布加迪

市场份额稳居前三！商汤智算服务持续领跑

国际权威咨询机构IDC近日发布《中国智算服务市场（2024上半年）跟踪》报告。报告显示，2024年上半年，商汤科技作为国内领先的智算服务商，以13.3%的市场份额稳居GenAI IaaS市场Top3，位列GenAI IaaS领域第一梯队。 Gen AI驱动，商汤站稳智算市场头部阵营2024上半年中国智算服务整体市场同比增长79.6%，市场规模达到146.1亿元人民币。

12/23/2024 5:22:00 PM

新闻助手

ABCoder 在大模型编程领域的探索

前言大语言模型（以下简称大模型或 LLM）真正意义上火出圈，应该算是 OpenAI 发布 ChatGPT 后（22 年底）。从这个时间开始，到现在为止，已经过了很长一段时间了，市面上也出现了一些编程工具，比如 MarsCode、Copilot 或者 Cursor 等比较火的结合 IDE 的插件和工具。而实际上：经过了这么长时间的 LLM 产品发展，大家的编程方式真的被改变了吗？

12/23/2024 4:02:39 PM

高文举

扒一扒o3-mini背后团队：3位华人核心成员，北大清华南开校友在列

比o1 mini性能更强，价格更低，性价比新王o3-mini再次引爆AI圈热议。在官方截图中，中等o3-mini的性能和o1 mini差不多，价格却只有后者的一半，整体延迟也和GPT-4o相当。最主要的，这表明了OpenAI可以在降低成本的同时提高性能。

12/23/2024 3:00:00 PM

量子位

李飞飞谢赛宁新作「空间推理」：多模态大模型性能突破关键所在

李飞飞谢赛宁再发新成果：直接把o1式思考拉至下一个level——多模态大语言模型的空间思维！这项研究系统评估了多模态大模型的视觉空间智能，结果发现：当前，即使是最先进的多模态大模型，在空间认知方面与人类相比仍有显著差距，测试中约71%的错误都源于空间推理方面的缺陷，即空间推理能力是当前主要瓶颈。图片更为有趣的是，在这种情况下，思维链、思维树等常用的语言提示技术直接失灵了——不仅没有提升模型在空间任务上的表现，反而会使性能下降。

12/23/2024 12:37:34 PM

大模型检索增强生成之向量数据库的问题

作为技术人员我想大家或多或少应该都接触过数据库技术，数据库技术的历史可以说是由来已久了；但数据库的发展也是一路曲折，特别是随着互联网体量的快速增加，对数据库的要求也变得越来越多。而且为了适应各种不同的业务场景，数据库系统也是紧跟潮流发展出多种类型的数据库；比如说传统的关系型数据库，缓存数据库，以及大数据处理的数据库；直到今天的向量数据库。关系型和缓存数据库就不用说了，今天我们就来聊聊向量数据库系统。

12/23/2024 11:31:05 AM

DFires

百川行业首创领域自约束训练方案，Baichuan4-Finance金融场景能力领先GPT-4o近20%

12 月 23 日，百川智能发布全链路领域增强大模型 Baichuan4-Finance。在高质量金融数据的基础上，通过行业首创的领域自约束训练方案，Baichuan4-Finance 实现了金融能力和通用能力同步提升的效果，极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力大幅领先 GPT-4o，在中国人民大学财政金融学院新近发布的评测体系 FLAME 以及国内主流开源金融评测基准 FinancelQ 上均登上榜首。

12/23/2024 10:34:00 AM

新闻助手

素数分布规律又有新发现！赵宇飞学生与牛津教授合作成果

赵宇飞高材生、哥伦比亚大学助理教授Mehtaab Sawhney（索尼），又为数学界贡献了一项重要成果——与牛津大学教授Ben Green（格林）一起，证明了一项关于素数分布的新规律。关键是证明中用到了与Gowers范数相关的技术，而Gowers范数一开始是拿来研究等差数列的，看上去和素数规律风马牛不相及。甚至作者索尼自己也表示，“作为一个‘局外人’，几乎不可能判断出这些事情是相关的”。

12/23/2024 10:00:00 AM

量子位