理论
Claude公司估值615亿美元再融35亿,那DeepSeek…
刚刚,Claude背后公司Anthropic官宣新一轮融资:35亿美元! 投后估值达到615亿。 在Clauede-3.7发布后,此轮新融资便浮出水面,并在今天正式公布。
3/4/2025 10:33:14 AM
一文读懂大模型 RAG:检索、增强与生成的技术详解
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分领域时,通用大模型往往面临专业知识不足的问题。 相对于成本昂贵的“Post-Training”或“Supervised Fine-Tuning”(监督微调,SFT),基于RAG的技术方案成为了一种更优选择。 本文笔者将从RAG所解决的问题及模拟场景入手,详细总结相关技术细节,与大家分享~一、初识:RAG所解决的问题及模拟场景1.
3/4/2025 9:10:00 AM
小喵学AI
DeepSeek提示词超能手册:五大核心技巧,榨干AI生产力!
🎯 技巧1:R-T-F黄金三件套——角色 任务 格式锁定AI身份,输出不跑偏! R (Role):角色,明确AI需要扮演的身份或专家领域。 T (Task):任务,清晰定义AI需完成的具体目标。
3/4/2025 12:35:00 AM
新叔
用上DeepSeek,改简历快人一步:AI简历优化保姆级教程
作为科技博主,我测评过上百款AI工具,今天给大家安利一个简历优化的"外挂神器"——DeepSeek。 它能让你的简历从"已读不回"变成"收割offer",操作比美图秀秀还简单,特别适合没经验的应届生和转行小白。 一、为什么需要AI改简历?
3/4/2025 12:00:55 AM
架构师秋天
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!硅谷知名投资人曝料特朗普希望马斯克更积极裁撤美政府预算
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。 但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。 作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。
3/3/2025 12:59:39 PM
言征
中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍
国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。 这项工作首次在 FPGA 上实现了视频生成模型(Video Generation Models, VGMs)的高效推理,也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM(FPGA’24)后的最新系列工作。 与 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升(峰值算力差距超过 21 倍)。
3/3/2025 12:16:48 PM
机器之心
大型视觉模型何时会有ChatGPT时刻?
2022年11月推出的ChatGPT是自然语言处理(NLP)的一个分水岭,因为它展示了转换器(Transformer)架构在理解和生成文本数据方面的惊人有效性,也被称为人工智能的ChatGPT时刻。 现在,随着预训练大型视觉模型(LVM)的兴起,我们在计算机视觉领域看到了类似的情况。 但是,这些模型何时才能将视觉数据广泛应用呢?
3/3/2025 10:13:09 AM
AI情报室
小白也能轻松理解的大模型入门锦囊!
一、何为大模型? 大模型,英文名叫Large Model,也被称为基础模型(Foundation Model)。 我们通常说的大模型,主要指的是其中最常用的一类——大语言模型(Large Language Model,简称LLM)。
3/3/2025 10:00:00 AM
小喵学AI
官方详解 DeepSeek-V3 / R1 推理系统:理论利润率达 545%
3 月 1 日消息,DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 . 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch . size,如何隐藏传输的耗时,如何进行负载均衡。
3/3/2025 9:00:00 AM
清源
DeepSeek突袭公布成本利润率:545%
五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位
DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元
分享五个在微信中使用 DeepSeek 的方法,建议收藏!
前言今天大姚将为大家分享5种在微信中使用DeepSeek的方法,帮助大家更好地利用这一工具,提升工作和学习效率。 无论是处理文档、管理知识,还是进行深度搜索和思考,这些方法都将为你带来全新的体验。 让我们一起探索DeepSeek在微信中的无限可能吧!
3/3/2025 8:06:39 AM
大姚
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元
DeepSeek+Xmind一键生成思维导图
大家好,我是岳哥。 我们工作和生活中,有时候遇到一本好书或者是别人写的一些比较有深度的文章,认真看完要花不少时间。 但是如果我们让DeepSeek帮我们看完,提取书籍或文章中的重点内容并生成思维导图,那就效率多了。
3/3/2025 3:35:00 AM
丶平凡世界
C#实战:基于腾讯云大模型知识引擎原子能力提供的文档解析API快速提取图片信息为MD文档
今天借助腾讯云大模型知识引擎原子能力提供的文档解析API快速提取图片信息为MD文档的WinFomr应用小案例,感兴趣的朋友可以看一下! 一、大模型知识引擎 LKE介绍官方介绍:大模型知识引擎(LLM Knowledge Engine),是面向企业客户及合作伙伴的,基于大模型的应用构建平台,结合企业专属数据,更快更高效地搭建Agent、RAG、工作流等多种模式应用,推动大语言模型在企业中的应用落地。 图片大模型知识引擎 LKE: 如何开通服务?
3/3/2025 2:00:00 AM
郝光明
DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽
DeepSeek开源周,今日正式收官! 内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。 具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统;Smallpond,基于3FS和DuckDB构建的轻量级数据处理框架。
3/3/2025 2:00:00 AM
绝了超简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程序,新手也能快速上手!
大家好,我是狂师。 在当今数字化时代,智能客服已成为提升用户体验、提高运营效率的关键工具。 今天,我们将为大家带来一个超级简单的教程,教你如何在短短3分钟内,利用腾讯微搭平台,将满血 DeepSeek R1接入到微信、公众号、小程序,打造属于自己的 AI 智能客服,哪怕你是新手也能轻松上手!
3/3/2025 12:25:00 AM
狂师
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用