AIGC宇宙 AIGC宇宙

理论

PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母

PyTorch大牛Horace He突然官宣,加盟Thinking Machines。 「在Meta,离职时发布一张工牌照片是一种传统。 遗憾的是,我找不到我的正式工牌了,所以只能用临时工牌代替」毕业后,在Meta的PyTorch工作4年后,Horace He终于决定换一种职业,探索一些新的事物。
3/6/2025 9:00:00 AM
新智元

基于BLIP-2和Gemini开发多模态搜索引擎代理

译者 | 朱先忠审校 | 重楼本文将利用基于文本和图像的联合搜索功能来开发一个多模态时装辅助代理应用程序。 简介传统模型只能处理单一类型的数据,例如文本、图像或表格数据。 多模态是人工智能研究界的一个流行概念,指的是模型能够同时从多种类型的数据中学习。
3/6/2025 8:50:44 AM
朱先忠

从DeepSeek看IT行业的未来:如何通过智能搜索技术提升企业竞争力

作者 | 涂承烨审校 | 重楼引言:智能搜索技术的颠覆性革命2025年,中国AI企业DeepSeek凭借其开源大模型DeepSeek-R1的横空出世,在全球AI领域掀起了一场技术革命。 这款模型的发布不仅标志着中国在AI技术上的自主突破,更以“低成本、高性能、开源开放”的特性重构了企业应用AI的范式。 其上线仅21天即突破2215万日活跃用户(DAU),超越ChatGPT登顶苹果应用商店下载榜,这背后不仅是技术的胜利,更是企业智能化转型需求爆发的缩影。
3/6/2025 8:00:00 AM
涂承烨

大模型系列:DeepSeek大模型与应用场景介绍

今天给大家聊聊DeepSeek 究竟有哪些强大的模型? 这些模型又适用于哪些具体的场景呢? 希望对大家了解 DeepSeek 大模型提供一些参考。
3/6/2025 7:28:31 AM
郝光明

为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理

给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」! 这一成就,再次让AI社区轰动。 博客地址::,能成功扩展到多模态推理领域吗?
3/6/2025 1:00:00 AM
新智元

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具,看谁更厉害!

先给 DeepSeek 泼一盆冷水,DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。 下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程,功能虽小,但还是能看出差距的。 这两天 Trae 不是推出了国内版吗 (), 搭载豆包和 DeepSeek 大模型,因为之前 Trae 国际版是支持 Claude Sonnet 的,最开始是 3.5,后来 Claude 升级了 3.7,隔了一天 Trae 就跟进了,而且也是完全免费的。
3/6/2025 12:22:00 AM
风筝

DeepSeek+Drawio一键生成20多种图表,90%都不知道的技巧(附保姆级教程)

大家好,我是岳哥。 DeepSeek目前还不支持直接画图,但是我们借助一些第三方工具,还是可以达到生成图表的效果。 今天继续给大家分享工作中的流程图,甘特图,统计图,如何通过DeepSeek来生成。
3/6/2025 12:08:00 AM
、平凡世界

4400万打水漂?马斯克阻止OpenAI营利化惨遭驳回!将秋季开庭判决;法官:收购提议太双标了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)马斯克4告OpenAI的连续剧,又有新进展了! 前情回顾下,马斯克与OpenAI对簿公堂是因为:他曾向非营利组织OpenAI捐赠超过4400万美元,而OpenAI的营利化转型,显然违反了当时的合同。 这都不是4400万打了水漂那么简单!
3/5/2025 6:38:28 PM
伊风

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

虽然 Qwen「天生」就会检查自己的答案并修正错误。 但找到原理之后,我们也能让 Llama 学会自我改进。 给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行?
3/5/2025 2:54:00 PM
机器之心

OpenAI计划将Sora整合到ChatGPT中

3月4日消息,2024年初,OpenAI宣布将Sora作为其首款人工智能文本转视频生成器。 ChatGPT的母公司在2024年12月发布了稳定版本。 现在,OpenAI透露,他们计划将Sora的视频生成器功能集成到ChatGPT中。
3/5/2025 11:23:44 AM
Yu

DeepSeek对数据治理的影响

DEEPSEEK作为智能一款助手,在数据治理体系中具有深远的影响。 它通过提供智能化、自动化和高效化的解决方案,推动企业在数据治理变革与领域的优化。 以下是EPSEEK对数据治理体系影响的多角度分析: 一、战略层面:推动数据治理目标的明确与实现1.
3/5/2025 10:29:12 AM
佚名

显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

o1/DeepSeek-R1背后秘诀也能扩展到多模态了! 举个例子,提问多模态大模型:“什么宝可梦可以释放技能十万伏特”时,模型通过推理过程准确找出皮卡丘对应的坐标框,展示出模型的泛化能力。 这是来自上海交大、上海AI Lab、港中文大学的研究人员推出的视觉强化微调开源项目——Visual-RFT (Visual Reinforcement Fine-Tuning), 只需10~1000条数据,就能通过思考过程和基于规则的监督提升多模态大模型的性能。
3/5/2025 10:21:04 AM
量子位

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5,口碑又意外反转了? 经过3千多轮比较,GPT-4.5在全部类别拿下第一,位居LLM竞技场首位! 「不看智商看情商」的GPT-4.5,不是推理模型,此前的基准测试中基本都是全班垫底,惨不忍睹。
3/5/2025 9:32:00 AM
新智元

如何高效使用DeepSeek-R1:推理大模型调优指南

如何高效使用DeepSeek-R1:推理大模型提示工程调优指南LLM 中 DeepSeek-R1 与传统非推理模型的交互方式存在本质差异。 在数学推导、代码生成等复杂任务中展现出色能力。 但与通用大模型不同,推理型模型需要特殊的交互策略,博文内容列举几个常见的优化手段,帮助开发者构建高效的交互范式。
3/5/2025 3:00:00 AM
山河已无恙

生物版DeepSeek的隐秘竞争,中国模型被视为更强对手,赛诺菲10亿美金押宝!

编辑 | ScienceAI上周,美国斯坦福大学、英伟达等机构联合发布的生物学AI模型Evo2引起广泛关注,被誉为「生物版Deepseek」。 正当全球科研人员为这一突破性成果热议时,该论文中的特殊标注揭开了中国AI的实力——来自中国公司百图生科xTrimo系列大模型,被Evo2的研究人员列为「参数规模更大但尚未开源的竞争对手」,揭示中国生物大模型的崛起。 实际上,百图生科公司一直被美国市场认定为生命科学基础大模型的先行者,自2020年起一直前瞻性地在该领域布局。
3/4/2025 6:22:00 PM
ScienceAI

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址:  : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调(Reinforcement Fine-Tuning,RFT)范式成功从纯文本大语言模型拓展到了视觉语言大模型(LVLM)。 通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!
3/4/2025 5:27:05 PM
机器之心

企业实施RAG过程中:常见误解与澄清,内含项目升级预告

春节之后的一个月的时间内,微信和小红书上数了下大概有 150 多个过来咨询 RAG 在企业落地的网友,一路聊下来按照对方的诉求大概分为三类,第一种是最多的就是年后返工公司领导让落地 RAG,但是一时没有头绪的过来咨询的;第二种是看过我公众号上的相关案例后,想外包给我来做具体实施的;第三种有点出乎意料的是,相关的媒体来交流行业观察的。 第一种类型也是最开始比较多的,最初我也是问啥答啥,但是大概聊了五六个之后发现情况有点不对,大部分其实是比较基础的问题,或者我认为问大模型能比问我更快扫盲的,再加上后来确实肉眼可见的人在变多,我索性和每个人说如果是咨询的话 200 块每小时(现在涨到了 500),这样就大部分人就索性不问了,虽说前后也是有十几个人很干脆的问完问题后直接发了红包,不过不得不说收费确实是个很好的互相筛选。 以上是碎碎念,言归正传,这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。
3/4/2025 10:53:59 AM
韦东东