AIGC宇宙 AIGC宇宙

理论

小时级部署交付,分钟级AI应用构建,这款火山引擎AI一体机如何做到的?

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)当前,DeepSeek的推出为企业智能化转型带来新的想象空间。 然而,想要短期内快速用好DeepSeek来服务企业自身的业务场景,绝非易事。 最为明显的一个现象是:没有进行整体的应用规划而直接本地部署DeepSeek,一旦接入实际的业务场景和数据,往往会导致效果不达预期,甚至适得其反。
3/7/2025 11:47:56 AM
云昭

如何在本地部署 DeepSeek 并提供接口用于开发AI对话应用?

最近,DeepSeek 异常火爆,堪称国产 AI 之光,并且它还是免费开源的。 只需打开 DeepSeek 对话界面,就能免费与其对话,让它解决你的问题,关键是它的回答质量非常高。 当然,本篇文章并不是介绍如何使用 DeepSeek 进行对话的,因为这太简单了,连我 5 岁的儿子都会用。
3/7/2025 10:36:21 AM
东方小月

另一个来自中国本土"DeepSeek"时刻?全球首个通用人工智能代理发布

I 圈又炸了锅! 另一个来自中国本土"DeepSeek"时刻今天,Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版!  这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版,而是一个 真正意义上的自主智能体,它最大的亮点在于:打通了从想法到执行的完整链路!
3/7/2025 10:12:16 AM
AI寒武纪

FP8 训练新范式:减少 40% 显存占用,训练速度提高 1.4 倍

近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。 这表明,FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。 近期,来自伯克利,英伟达,MIT 和清华的研究者们提出了显存高效的 FP8 训练方法:COAT(Compressing Optimizer states and Activation for Memory-Efficient FP8 Training),致力于通过 FP8 量化来压缩优化器状态和激活值,从而提高内存利用率和训练速度。
3/7/2025 10:02:10 AM
机器之心

如何理解模型的蒸馏和量化

在LLM领域内,经常会听到两个名词:蒸馏和量化。 这代表了LLM两种不同的技术,它们之间有什么区别呢? 本次我们就来详细聊一下。
3/7/2025 8:00:00 AM

重磅开源!基于 Spring Boot 的企业级 DeepSeek 知识库与智能对话方案

本项目基于 Spring Boot 3.4 构建,旨在打造一款高效、智能的企业级知识库与智能对话平台,充分集成 DeepSeek 大语言模型,以支持企业级私有化部署和智能客服应用。 项目目标该方案通过整合 DeepSeek 强大的自然语言处理能力,实现高效、精准的对话交互,同时支持企业知识库的管理,助力企业构建智能化的客户支持与内部知识共享体系。 技术架构后端基于 Spring Boot 3.4 开发,提供 RESTful API 以处理业务逻辑,并与 DeepSeek 模型进行高效交互。
3/7/2025 7:57:56 AM
路条编程

我用DeepSeek做了一个AI获客工具

其实去年我就有做AI获客的想法了。 当时帮一个外贸公司做过自动分析客户级别以及自动生成邮件的项目,了解到他们对获取客户的需求非常迫切。 他们通常从谷歌浏览器、会展名单以及海关数据中获取客户信息,但是整个过程非常耗时。
3/6/2025 1:10:32 PM
贝塔街的万事屋

32B逆袭671BDeepSeek R1!阿里推理模型炸翻了:小到笔记本就能run,成本仅1/10!又是强化学习带来惊喜!

编辑 | 伊风太震撼了。 阿里直接扔了一张王炸! QwQ-32B,一个参数量如此小的小模型,居然追平了671B的DeepSeek-R1?
3/6/2025 12:43:03 PM
伊风

利用DeepSeek人工智能和人工智能可解释性预防银行欺诈

分析人工智能驱动的欺诈检测使用XGBoost、SHAP和实时仪表板提高了准确性和透明度,提供了可扩展的解决方案来打击欺诈。 随着人工智能(AI)和机器学习(ML)的发展,银行业的欺诈检测取得了显著进展。 然而,一个持续存在的挑战是欺诈决策的可解释性——我们如何证明为什么一个特定的交易被标记为欺诈?
3/6/2025 11:35:18 AM
Harris编译

离谱!OpenAI被曝博士级AI智能体2万美元/月,网友:DeepSeek快把价格打下去

什么样的AI,值得你花20000刀一个月? OpenAI告诉你:用我们的博士级AI智能体吧,它保管值! 今天这个消息,让所有人瞠目结舌:OpenAI的高管们计划发布三类智能体产品,价格分几档,最贵的一档月费高达2万美金。
3/6/2025 11:31:10 AM
新智元

OpenAI计划推2万美元包月的博士级智能体,你愿意买单吗?

近日,OpenAI计划推出一款“博士级研究智能体”,每月收费高达2万美元(约合人民币14.5万元),引发了科技界的广泛关注。 这款智能体旨在处理学术研究和软件开发中的复杂任务,其强大的处理能力和深度学习算法,将为用户提供前所未有的服务体验。 OpenAI试水高端智能体OpenAI此次推出的博士级智能体并非单一产品,而是其AI智能体产品线中的高端版本。
3/6/2025 10:47:02 AM
小菲

AI屠戮白领,大学文凭变「废纸」!美高中重开体力课,年薪40万不是梦

OpenAI首个NextGenAI联盟正式成立! 联盟汇聚了15家领先研究机构,包括Caltech、MIT、哈佛等顶尖学府,创始阵容堪称豪华。 其中,研究资助、计算资金和API访问权限都将由OpenAI负责提供,全力支持学生、教育工作者和研究人员探索AI前沿应用。
3/6/2025 9:30:00 AM
新智元

一头大象难倒ChatGPT,Grok 3完美通关

ChatGPT新Bug引热议:无法画出“有0头大象的房间”。 要么会出现真实画风的大象,要么会出现玩具象,很多网友重复了很多次都是通用的结果。 假如后续追问“那图里右边灰色的东西是什么?
3/6/2025 9:10:00 AM
量子位

PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母

PyTorch大牛Horace He突然官宣,加盟Thinking Machines。 「在Meta,离职时发布一张工牌照片是一种传统。 遗憾的是,我找不到我的正式工牌了,所以只能用临时工牌代替」毕业后,在Meta的PyTorch工作4年后,Horace He终于决定换一种职业,探索一些新的事物。
3/6/2025 9:00:00 AM
新智元

基于BLIP-2和Gemini开发多模态搜索引擎代理

译者 | 朱先忠审校 | 重楼本文将利用基于文本和图像的联合搜索功能来开发一个多模态时装辅助代理应用程序。 简介传统模型只能处理单一类型的数据,例如文本、图像或表格数据。 多模态是人工智能研究界的一个流行概念,指的是模型能够同时从多种类型的数据中学习。
3/6/2025 8:50:44 AM
朱先忠

从DeepSeek看IT行业的未来:如何通过智能搜索技术提升企业竞争力

作者 | 涂承烨审校 | 重楼引言:智能搜索技术的颠覆性革命2025年,中国AI企业DeepSeek凭借其开源大模型DeepSeek-R1的横空出世,在全球AI领域掀起了一场技术革命。 这款模型的发布不仅标志着中国在AI技术上的自主突破,更以“低成本、高性能、开源开放”的特性重构了企业应用AI的范式。 其上线仅21天即突破2215万日活跃用户(DAU),超越ChatGPT登顶苹果应用商店下载榜,这背后不仅是技术的胜利,更是企业智能化转型需求爆发的缩影。
3/6/2025 8:00:00 AM
涂承烨

大模型系列:DeepSeek大模型与应用场景介绍

今天给大家聊聊DeepSeek 究竟有哪些强大的模型? 这些模型又适用于哪些具体的场景呢? 希望对大家了解 DeepSeek 大模型提供一些参考。
3/6/2025 7:28:31 AM
郝光明

为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理

给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心