理论
DeepSeek 悄然发布 DeepSeek-V3–0324:远超预期的重大升级
DeepSeek 近期悄然发布的 DeepSeek-V3–0324,在 AI 社区和行业内引发了广泛关注。 这一版本是 DeepSeek V3 (DeepSeek-V3 深度剖析:下一代 AI 模型的全面解读)模型的重要升级,其带来的一系列技术革新和性能提升远超众人预期,为开发者和企业带来了新的机遇与可能。 一、DeepSeek-V3–0324 的技术突破(一)Multi-head Latent Attention(MLA)和增强的 DeepSeekMoE 架构DeepSeek-V3–0324 引入了 Multi-head Latent Attention(MLA)和增强版的 DeepSeekMoE 架构,这些创新技术为模型性能的提升奠定了坚实基础。
3/28/2025 4:30:00 AM
大模型之路
DeepSeek-V3-0324 发布:更智能的编码体验,加速码农编码效率!
DeepSeek V3 迎来了全新版本的更新;消息一经发布,众多专业人士纷纷对其进行测评,结果令人惊叹不已。 尽管官方将此次升级定义为小版本更新,但在实际的编码能力测试中,其表现丝毫不逊色于大版本的 DeepSeek V4。 在此,我为大家提供一个专业的测评网址:。
3/28/2025 2:00:00 AM
DeepSeek上线次月月活用户达1.8亿,AI大模型应用增长迅猛
在当今数智化时代,人工智能(AI)技术的飞速发展正深刻改变着我们的生活和工作方式。 尤其是AI大模型的应用,正成为互联网行业增长的新引擎。 根据QuestMobile发布的最新数据,AI大模型的应用呈现出迅猛的增长态势,其中DeepSeek APP的表现尤为引人注目,其上线次月的活跃用户规模就突破了1.8亿大关。
3/27/2025 12:27:13 PM
AI Infra的起飞前夜,跟两位创业者聊了两小时,从DeepSeek的中国朋友圈,到AI基建演进的价值铁律:流量重赏下的勇夫
作者 | 云昭嘉宾 | 黄新平、谭中意出品 | 51CTO技术栈(微信号:blog51cto)“人生不无聊,有太多变化,太多好玩的事情发生。 ”的确,近期围绕DeepSeek的新发布实在太多了,乱花渐欲迷人眼。 从春节期间企业抢先宣布接入DeepSeekR1、继而接入满血版R1,到DeepSeek一体机的出圈,再到国民应用微信的接入,潮潮迭起。
3/27/2025 12:15:44 PM
云昭
必看!SpringAI轻松构建MCP Client-Server架构
MCP 这个概念相信大家已经听了无数次了,但不同人会有不同的解释,你可能也是听得云里雾里的。 不过没关系,今天这篇内容会通过 Spring AI 给你实现一个 MCP 的 Client 和 Server 架构,让你彻底搞懂 MCP 的概念,以及学会 MCP 的开发技能。 什么是MCP?
3/27/2025 11:34:11 AM
磊哥
揭秘MCP:AI大模型的万能接口,开启智能新时代
在人工智能的世界里,最近有个新名字频频被提起:MCP(模型上下文协议,Model Context Protocol)。 这个由Anthropic在2024年11月推出的开放标准,正悄然改变着大型语言模型的玩法。 它就像一座桥梁,把那些被困在“信息孤岛”里的AI模型和外部世界连接起来,让它们不再只是会聊天,而是能真正干实事。
3/27/2025 10:15:39 AM
凌晨2点,再次Open!奥特曼宣布:OpenAI正式支持对手MCP协议
自从昨天OpenAI将GPT-4o的原生图像生成同步开放给免费用户后,今天他们又Open了一把。 就在刚刚,OpenAI对其Agents SDK进行了重大更新,支持了对手Anthropic推出的MCP服务协议。 凌晨2点,奥特曼便迫不及待地公布了这个消息。
3/27/2025 10:12:49 AM
新智元
关于智能体 Agent 的实现技术之思维链和函数调用 (function call) 的思考
Agent技术也被业界称为智能体技术,本质上是使得大模型具备独立思考和解决问题的能力;被广泛应用于各种应用场景,而且也被称为是实现通用人工智能的一种技术手段。 但在此之前对于智能体的理解比较肤浅,而今天突然发现原来智能体没我们想象中的那么简单,也没想象中的那么复杂。 今天我们就从Agent的两个实现技术之思维链和函数调用来重新理解智能体。
3/27/2025 8:10:00 AM
AI探索时代
随着AI大模型和MCP生态发展,传统低代码平台和RPA类产品还有无出路?
今天准备跟大家聊一下随着AI大模型和MCP协议生态的发展,对传统的低代码产品和RPA机器人产品所带来的一些影响。 因为在一年多前我其实就聊过这个话题,但是最近一年的时间AI大模型、AI编程、AI智能体,包括最近的MCP协议生态的发展太快了,导致原来我们对这两个产品的影响分析会出现一些变化。 低代码平台影响分析首先我们先讲一下低代码,大家都知道其实低代码平台的产品,它的本质仍然是辅助我们编程,仍然是可能会生成源代码或者是生成低代码产品模板引擎能够解析的元数据。
3/27/2025 5:00:00 AM
何明璐
星辰与代码:DeepSeek的发展历程
技术突破阶段2024 年,DeepSeek 强势开启生态扩张与技术爆发的新纪元,成为全球 AI 领域瞩目的焦点。 年初 1 月,DeepSeek 便以 DeepSeek-MoE 震撼登场,创新性架构设计以仅 60% 的计算量损耗,成功超越 Llama 2-7B 性能,为后续技术突破奠定坚实基础,在模型效率优化上迈出关键一步。 紧接着 2 月,DeepSeekMath 在 MATH 基准测试中表现惊艳,成绩飙升至 51.7%,无限逼近 GPT-4 水平,数学推理能力实现质的飞跃,极大提升了模型在复杂数学问题求解上的可靠性与精准度。
3/27/2025 3:50:00 AM
小牛呼噜噜
重磅发布!ChatGPT ImageGen “Shiba” 震撼来袭:你从未见过的强大AI图像生成模型!
引言期待已久的ChatGPT ImageGen终于迎来重大更新! 代号为“Shiba”的全新模型正式发布,而我可以毫不犹豫地说,这绝对是我目前为止使用过的最强大的AI图像生成工具! 无论是在Prompt理解、生成质量,还是在文字排版、编辑能力和角色一致性等方面,“Shiba”都展现出了前所未有的卓越性能,可以说是全面碾压!
3/27/2025 12:04:33 AM
深海幽光
企业在AI创新与安全之间走钢丝
根据Zscaler的数据,全球范围内AI/ML工具的使用激增,企业纷纷将AI融入运营之中,员工也在日常工作流程中加以运用。 该报告显示,企业使用AI/ML工具的数量同比增长了3000%以上,凸显出各行业迅速采用AI技术,以解锁生产力、效率和创新的新水平。 这些发现基于Zscaler云在2024年2月至12月期间分析的5365亿笔AI和ML交易。
3/26/2025 11:26:37 AM
RAG检索全攻略:Embedding与Rerank模型的终极指南
在构建基于检索增强生成(RAG)的系统时,Embedding Model和Rerank Model扮演着至关重要的角色。 比如你正在搭建一个智能搜索引擎,Embedding Model就像是帮你快速找到相关书籍的“图书管理员”,而Rerank Model则像是一位经验丰富的“资深书评人”,负责从一堆书里精准挑选出最符合你需求的那几本。 两者配合,就像一对完美搭档,确保RAG系统既能找到大量信息,又能精准提炼出最关键的内容。
3/26/2025 11:05:13 AM
OpenAI直播狙击谷歌,奥特曼AGI梗图现场直出!GPT-4o超强原生生图来袭
就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久,OpenAI也有动作了。 奥特曼亲自带队,展示了GPT-4o图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。 整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。
3/26/2025 10:21:58 AM
新智元
OpenAI在图片领域站起来了!
出品 | 51CTO技术栈(微信号:blog51cto)26日凌晨,OpenAI推出了GPT4o图像生成,可以说解决了此前Midjourney等扩散模型很难解决的问题,业内为之大为赞叹。 这是用手机拍摄的玻璃白板的广角图像,拍摄地点是一间俯瞰海湾大桥的房间。 视野中可以看到一位女士正在写字,她身穿一件印有大型 OpenAI 标志的 T 恤。
3/26/2025 9:29:12 AM
DeepSeek 为什么这么牛?幻方三大核心技术解密!
梁文峰说,我们缺的从来都不是钱,而是高端芯片。 幻方官网显示,2022年,公司员工“一只平凡的小猪”一个人就向捐助了1.38亿。 你说,这是钱的事吗?
3/26/2025 9:00:00 AM
架构师之路
手把手教你实现 Ollama+FastGPT+DeepSeek 打造个人专属 AI 知识库!
本文从零实现,基于Ollama、FastGPT、Deepseek在本地环境中打造属于自己的专业知识库,与大家分享~一、本地部署OllamaOllama是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大语言模型(LLM)而设计,无需依赖云端服务。 它提供简单易用的界面和优化的推理引擎,帮助我们轻松加载、管理和运行各种AI模型。 1.
3/26/2025 8:50:00 AM
小喵学AI
传神语联发布深度思考大模型-T1:根原创铸基,任度双脑开启AI深度思考新高度
2025年3月24日,传神语联A纪元系列线上发布活动的第一天,传神语联重磅发布任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。 那么,你或许会好奇,在大模型层出不穷的今天,传神语联为什么还执着于推出大模型? 底气来自哪里?
3/25/2025 5:59:13 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用