大模型
国产大模型「五强争霸」,决战AGI!
DeepSeek的横空出世,已经彻底改变了全球的AI局势。 从此,不仅中美大模型竞争格局改变,国产大模型的产业版图,也被一举打破! 纵观中国基础大模型的市场,可以看到,如今的基础大模型版图已然改天换地,演变为全新的五强格局——字节、阿里、阶跃星辰、智谱,以及DeepSeek。
5/13/2025 2:00:22 AM
新智元
痛斥!现在的MCP,就像尿裤子!创业CTO试用后怒气值飙升,开怼整个大模型圈怪象:开发文档用大模型写的!网友:召唤MCP适配器
作者 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)现在的MCP乃至大模型开发圈,就像尿了裤子! 一开始热乎乎的,然后就开始难受了! 近日,一篇有关MCP深度批判的博客文章《A Critical Look at MCP》在网络上走红。
5/12/2025 3:07:01 PM
云昭
国内首个自研通用具身智能大模型 “自变量机器人” 完成数亿元融资
近日,具身智能公司 “自变量机器人” 宣布成功完成了 Pre-A 轮和 A 轮两轮融资,融资总额达到数亿元。 这一融资活动由华映资本和美团领投,标志着该公司在推动通用具身智能技术的道路上迈出了重要一步。 自变量机器人自2023年成立以来,已完成七轮融资,累计融资金额超过10亿元。
5/12/2025 3:00:52 PM
AI在线
一年半融资七轮超10亿!自变量机器人再获美团数亿元A轮加码
据《智能涌现》消息,成立不到一年半的具身智能公司「自变量机器人」(X Square Robot)近日完成数亿元A轮融资,由美团战投领投,美团龙珠跟投。 本轮资金将主要用于加速其全自研端到端通用具身智能大模型与机器人本体的同步迭代,并推动未来在多个应用场景的智慧化方案合作与落地。 值得注意的是,在本次A轮融资前,自变量机器人还完成了由光速光合、君联资本领投的数亿元Pre-A 轮融资(今年2月披露),以及由华映资本、云启资本、广发信德投资的数亿元Pre-A 轮融资。
5/12/2025 10:01:17 AM
AI在线
Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频
本周二,我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具,来验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。 在项目中,他开发了一个用于自动(或半自动)证明分析中估计值的框架。 估计值是 X≲Y(在渐近记法中表示 X=O (Y))或 X≪Y(在渐近符号中表示 X=o (Y))形式的不等式。
5/12/2025 9:05:00 AM
曝国行版iOS18.6启用部分苹果AI 百度阿里提供技术支持
近日,苹果记者Mark Gurman爆料称,国行版苹果iOS18.6即将启用部分Apple Intelligence功能,而这一功能的实现将由百度和阿里共同提供技术支持。 据了解,在此次合作中,阿里负责开发审查引擎。 与此同时,百度将自身AI技术与苹果的Siri和Visual Intelligence进行深度整合。
5/11/2025 10:00:42 AM
AI在线
12GB 显存可实现 128K 上下文 5 并发会话,IBM 预览 Granite 4.0 Tiny 模型
该模型采用混合 Mamba-2 / Transformer 架构,现有版本总参数规模为 7B、活动参数为 1B,可在消费级硬件上实现可用的体验。
5/10/2025 11:46:11 AM
溯波(实习)
谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%
谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。
5/10/2025 11:14:22 AM
故渊
Gemini API推出隐式缓存功能,开发者成本降低75%
Gemini API推出隐式缓存(Implicit Caching)功能,为开发者带来显著的成本优化体验。 新功能无需开发者手动创建缓存,当请求与先前请求共享共同前缀时,系统将自动触发缓存命中,提供高达75%的Token折扣。 此更新已覆盖Gemini2.5Pro和2.5Flash模型,进一步提升了AI开发的成本效益。
5/9/2025 4:00:51 PM
AI在线
商汤科技迈向多模态大模型的新纪元
在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。 尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。 商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。
5/9/2025 4:00:51 PM
AI在线
智能音箱迎来AI时代 新技术渗透率超20%
在技术迅速发展的今天,智能音箱的 “智商” 也在不断提升。 近日,快科技报道称,凭借 AI 大模型的加持,智能音箱在智能化领域实现了质的飞跃。 根据洛图科技(RUNTO)的数据显示,2025年第一季度,中国智能音箱市场的销量达到了369.9万台,尽管同比下降了5.6%,但整体行业的技术升级势头依然强劲。
5/9/2025 10:01:41 AM
AI在线
阿里巴巴开源 ZeroSearch 搜索引擎:训练成本大幅降低 80%
近日,阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎,这一新工具通过强化学习框架,极大地提高了搜索能力,并且在训练过程中不需要与真实搜索引擎互动。 ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识,快速生成相关内容,并且可以动态控制生成内容的质量。 与传统的搜索引擎相比,ZeroSearch 的训练成本显著降低。
5/9/2025 9:00:59 AM
AI在线
阿里开源大模型搜索引擎 ZeroSearch,大幅降低成本
近日,阿里巴巴在 Github 等平台正式开源了其全新研发的大模型搜索引擎 ZeroSearch。 这款搜索引擎以强化学习框架为基础,能够在无需与真实搜索引擎交互的情况下,激发大模型的搜索能力。 ZeroSearch 的核心技术是利用大模型在大规模预训练过程中积累的丰富知识,将其转化为一个高效的检索模块。
5/9/2025 9:00:59 AM
AI在线
谷歌推出iPad专属Gemini应用,赋能多任务处理新体验
近日,谷歌正式发布了一款专为iPadOS设计的全新应用 ——Gemini。 这款应用的推出旨在提升用户在多任务处理和创作方面的效率,充分利用了 iPad 的大屏幕优势。 Gemini 支持分屏功能,让用户能够在同一界面上同时进行多个任务,极大地方便了用户的日常使用。
5/8/2025 6:00:57 PM
AI在线
商汤万象平台稳居国内AI大模型市场第二,未来前景光明
近日,国际数据公司(IDC)发布的最新报告《中国模型即服务 (MaaS) 及 AI 大模型解决方案市场追踪(2024H2)》显示,商汤科技旗下的万象平台在国内 AI 大模型解决方案市场中表现抢眼,凭借13% 的市场份额稳居第二,继续引领行业的第一梯队。 这一成就不仅展示了商汤在 AI 领域的实力,更凸显了整个行业的发展潜力。 报告指出,2024年中国的 AI 大模型解决方案市场正在迎来爆发式增长,全年市场规模预计将达到34.9亿元人民币,较去年同比增长高达126.4%。
5/8/2025 4:00:46 PM
AI在线
谷歌发布专为 iPad 设计的 Gemini 应用,提升多任务处理体验
谷歌正式推出了专为 iPadOS 系统设计的 Gemini 应用。 此前,用户只能通过兼容模式在 iPad 上使用 iOS 版本的 Gemini,使用体验相对有限。 而新的 iPad 专属应用将大大提升用户的使用体验。
5/8/2025 12:01:06 PM
AI在线
Mistral 发布 Medium 3 大模型:前沿级性能与低成本兼具,提供多种企业功能
该模型在各项基准测试中的表现都达到或超过了 Anthropic Claude Sonnet 3.7 的 90%,成本则为每百万 Token 输出 0.4 美元、每百万 Token 输出 2 美元。
5/8/2025 11:07:40 AM
溯波(实习)
北大、清华联合发布!大模型逻辑推理能力新突破
在当前人工智能领域,大语言模型(LLMs)取得了显著成就,但其逻辑推理能力依然显得不足。 为了提升这一能力,来自北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学以及阿布扎比的 MBZUAI 等五所高校的研究人员,联合发布了《Empowering LLMs with Logical Reasoning: A Comprehensive Survey》综述论文,聚焦于逻辑推理的两大关键问题:逻辑问答和逻辑一致性。 研究表明,大语言模型在处理复杂逻辑推理时存在明显的短板。
5/8/2025 10:00:54 AM
AI在线
资讯热榜
腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线
OpenAI低调更新GPT4o模型,多项能力反超DeepSeek
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线
东风日产N7首款接入DeepSeek大模型,实现智能化人机交互
腾讯云上线DeepSeek全系API接口并打通联网搜索
微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测