AIGC宇宙 AIGC宇宙

AI

李彦宏最新财报会议内容流出:百度从DeepSeek身上学到了一件事;调用量涨30倍百度AI搜索的打法;50亿股票回购回馈股东

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)开年,各大科技巨头都被DeepSeek狠狠冲击已经近三周。 本周将会迎来各大公司的2024的Q4财报会议。 百度率先公开了过去三个月取得的成绩。
2/19/2025 4:01:29 PM
言征

DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此

DeepSeek爆火甚至引发API低价内卷……但是别忘了开源模型的最大好处是提供了“巨人的肩膀”啊! 微调DeepSeek-V3/R1,低成本打造高质量私有模型、提高业务竞争力,或许才是当下行业内更迫切的需求。 就在刚刚,已收获近4万GitHub StarColossal-AI发布开源大模型后训练工具箱,它包含:DeepSeek-V3/R1满血671B LoRA低成本SFT微调;完整的强化学习工具链PPO、GRPO、DPO、SimPO等;无缝适配DeepSeek系列蒸馏模型在内的HuggingFace开源模型;兼容支持英伟达GPU、华为昇腾NPU等多种硬件;支持混合精度训练,gradient checkpoint等训练加速降低成本;灵活的训练配置接口,支持自定义奖励函数、损失函数等;提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO和Offload等,以适应不同硬件规模。
2/19/2025 2:02:11 PM
量子位

Spring Boot + DeepSeek:解锁 AI 开发新姿势

在当今数字化时代,人工智能(AI)技术正以前所未有的速度改变着我们的生活和工作方式。 作为开发者,我们一直在寻找更高效、更智能的方式来构建应用程序。 今天,我们要为大家介绍一个强大的组合:Spring Boot DeepSeek,这将为你的应用注入智能新动力,开启 AI 开发的新篇章。
2/19/2025 12:00:00 PM
Java技术营地

DeepSeek-V3深入解读!

上一篇文章对DeepSeek-R1进行了详细的介绍,今天来看看DeepSeek-R1的基座模型DeepSeek-V3。 项目地址::现有的开源模型在性能和训练成本之间往往难以达到理想的平衡。 一方面,为了提升模型性能,需要增加模型规模和训练数据量,这会导致训练成本急剧上升;另一方面,高效的训练和推理架构对于降低计算资源消耗至关重要。
2/19/2025 10:49:30 AM
Glodma

Deepseek 这么厉害,普通人怎么用好它?

最近,Deepseek 的风头可谓是一时无两,相关消息一波接着一波。 它强大的能力让人惊叹不已,写代码、做翻译、生成文案……简直无所不能! 不少小伙伴跃跃欲试,却又担心自己不是程序员、不会写代码,用不好这么“高大上”的工具。
2/19/2025 8:50:05 AM
架构精进之路

谷歌憋大招:Gemini 将内嵌 AI 视频生成,让人人都能是导演

科技媒体 Android Authority 昨日(2 月 18 日)发布博文,报道称谷歌旗下 AI 助手 Gemini 即将具备生成视频能力。该功能虽未正式上线,但种种迹象表明,谷歌正在积极为 Gemini 添加新功能,旨在打造更强大的 AI 工具。
2/19/2025 8:28:11 AM
故渊

DeepSeek-R1详细解读!

DeepSeek-R1爆火,今天来详细看下。 论文地址::::现有LLMs在推理任务上的改进主要依赖监督微调(SFT)和后训练(Post-Training)方法,但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链(Chain-of-Thought, CoT)提升了性能,但其测试时扩展仍存在挑战。
2/19/2025 8:00:00 AM
GoldMa

超简单:三步教你搞定DeepSeek本地部署

最近,国产AI神器DeepSeek爆火,其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。 可以这么说,DeepSeek的问世,推动了AI大模型的跨越式发展。 作为一款AI领域的现象级产品,DeepSeek的用户量在短时间内暴增,服务器也被大量攻击,不少小伙伴在使用DeepSeek时,经常会出现服务器繁忙的提示。
2/19/2025 7:53:19 AM
冰河

Kimi大幅削减广告预算,DeepSeek崛起令月之暗面压力倍增

在国内 AI 领域,Kimi 曾是备受关注的创业产品,但随着 DeepSeek 的崛起,这一局面正悄然改变。 近日,月之暗面公司宣布将大幅削减 Kimi 的广告投放预算,暂停多个安卓渠道的推广以及与第三方广告平台的合作,这一决策显然是对 DeepSeek 迅猛发展的直接反应。 根据界面新闻的报道,DeepSeek 在短短数十天内成功吸引了3500万日活跃用户,而 Kimi 在过去一年多的时间内投入大量资金,日活跃用户却未能突破千万。
2/18/2025 5:09:00 PM
AI在线

终于找到答案了!DeepSeek凭啥能给出这么丰富的答案 - 反事实推理(上)

为什么deepseek的回答如此丰富,如此多维度? 今天和大家聊聊,deepseek核心技术(之一):反事实推理。 什么是反事实推理?
2/18/2025 3:13:13 PM
58沈剑

OpenAI 要开源新模型?CEO 奥尔特曼公开征求意见

OpenAI 首席执行官萨姆・奥尔特曼于当地时间 2 月 17 日在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,另一种则是“尽可能优化的手机大小模型”。这或许意味着 OpenAI 即将开源新的大模型,也将是 2019 年 OpenAI 开源 GPT-2 之后再次开源某个大模型。
2/18/2025 12:06:39 PM
远洋

OpenAI 联合创始人 Sutskever 的 AI 初创公司估值飙升至 300 亿美元,目标打造安全超级智能

据彭博社报道,知情人士透露,OpenAI 联合创始人伊利亚・苏斯科弗(Ilya Sutskever)正在以超过 300 亿美元(IT之家备注:当前约 2179.12 亿元人民币)的估值为其初创公司 Safe Superintelligence(以下简称 SSI)筹集超过 10 亿美元(当前约 72.64 亿元人民币)的资金,使 SSI 一举跻身全球最有价值的私人科技公司行列。
2/18/2025 11:21:38 AM
远洋

13 款帮助你提高工作效率的 AI 工具

Promptmetheus — 别再浪费时间微调提示了如果你曾经玩过 ChatGPT,你就会知道写出好的提示词是一门艺术。 有时候它会给你一个惊人的答案,有时候就像在跟一个智障的机器人聊天。 我使用 Promptheus 是因为它可以帮助我像代码一样组织我的提示。
2/18/2025 10:56:18 AM
佚名

DeepSeek引发开源生态新思考,欧洲AI巨头Mistral力挺开源

在AI技术快速发展的当下,开源与闭源的争论一直是行业焦点。 近期,DeepSeek的崛起引发了新的讨论,而被称为“欧洲OpenAI”的Mistral公司CEO亚瑟·曼什(Arthur Mensch)则明确表示,DeepSeek的开源模型为整个行业带来了重要机遇。 Mistral自2023年在法国巴黎成立以来,一直致力于推动开源生态的发展。
2/18/2025 10:34:36 AM
小菲

大模型 Prompt 技巧全解析

作者 | mitin在数字化浪潮的推动下,AI大模型以其卓越的自然语言处理能力和智能交互特性,迅速在很多领域中占据了重要地位。 比如:与传统客服相比,AI大模型展现出了无可比拟的优势,通过精心设计的 prompt,能使我们在客服托管、智能客服等多个项目和业务场景中发挥显著作用,大幅提高工作效率,优化成果质量。 为了精进个人能力以及助力产研学习氛围的提升,本人在学习完吴恩达教授以及其他前辈们有关 prompt 的课程之后,整理了这份学习资料,以供大家学习交流。
2/18/2025 10:25:10 AM
腾讯技术工程

DeepSeek 官方制定的《DeepSeek实用集成》要不要了解一下?

介绍DeepSeek官方下场做了一个大《DeepSeek实用集成》推荐列表,旨在方便开发者和用户了解如何将 DeepSeek 的强大能力应用到不同的场景中。 可以将其理解为一个 DeepSeek 生态的软件集成索引或资源导航页。 官方文档将集成方案分为了以下几个类别:(1) 应用程序:各种桌面应用、Web 应用,覆盖聊天、笔记、文献管理、翻译等常见场景。
2/17/2025 4:45:40 PM
IT运维技术圈

OpenAI ChatGPT 在心理治疗领域通过图灵测试,AI 比人类更具同理心

人工智能在心理治疗领域的应用展现出巨大潜力,但仍需谨慎。未来的研究应关注如何在保障治疗质量的前提下,将人工智能有效融入心理健康服务体系。
2/17/2025 2:53:58 PM
故渊

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

如今,DeepSeek团队成员的一举一动,都颇受圈内关注。 近日,来自DeepSeek、上海交通大学、香港科技大学的研究人员推出的全新力作CODEI/O,就获得了Ai2大牛Nathan Lambert的力荐! 论文地址::,非常高兴能看到DeepSeek团队成员撰写的更多论文,而不仅仅是有趣的技术报告。
2/17/2025 2:34:52 PM
新智元