理论
智源开源多模态向量模型BGE-VL,助力多模态检索!
智源研究院开源了多模态向量模型BGE-VL,助力主要多模态检索任务达到SOTA。 论文地址:: : :现有的多模态检索模型大多基于预训练的视觉-语言模型,这些模型主要通过文本-图像匹配任务进行预训练,对于其他常见的多模态任务(如组合图像检索和多模态文档检索)表现不足。 为了增强模型的多任务能力,研究者们开始采用指令微调的方法,但高质量的指令微调数据稀缺且难以大规模获取。
3/19/2025 9:30:00 AM
Glodma
总有人问,出海怎么用 DeepSeek 满血版(别问了,上答案)
有好几个小伙伴问我,他们出海业务,该怎么用DeepSeek满血版,今天直接告诉你答案:毫无疑问,AWS Bedrock是不二的选择。 出海DeepSeek云平台的选择,主要需要考虑这么几个因素:是不是大平台?对平台上大模型的接入,是严格,还是放水?是不是战略上支持DeepSeek? 有没有上下游配套基础设施?
3/19/2025 9:00:00 AM
架构师之路
一睁眼就被老祖宗追着骂,AI古人「回答我」视频火了(附教程)
这两天,老祖宗们连上了 wifi,天天逮着人就骂。 唐玄宗 0 帧起手,对着镜头就是一顿灵魂拷问:原来威严不容侵犯的皇帝也这么有梗啊。 江南四大才子文徵明听说有人骂他笨,直接整破防:这还是苏州博物馆官方亲自下场整的活儿,没想到知识竟以如此暴躁的方式进入脑子里。
3/18/2025 6:44:00 PM
AI好好用
曝阿里内部在开发AI杀手级应用,相信会比抖音更受欢迎!吴泳铭要求把AI促增长写进所有部门绩效
出品 | 51CTO技术栈(微信号:blog51cto)刚刚得到消息,阿里将很快推出一系列AI原生应用,内部知情人士表示:公司内部相信“基于AI的杀手级应用可能很快就出现,甚至会比抖音更受欢迎”。 知情人士透露,阿里所有部门已被告知,他们2025年的绩效将通过如何利用AI促进增长来评估。 淘宝和天猫在内的核心电子商务部门被鼓励采用更多的AI技术。
3/18/2025 1:14:47 PM
o1/o3后训练负责人离职创业,奥特曼把OpenAI玩成另一个YC孵化器了
OpenAI高管离职潮继续:CTO Mira卷着一票人才集体出走之后,刚刚,后训练研究副总裁William Fedus也官宣离职创业了。 他在不到半年前,也就是去年10月刚刚晋升——没错,彼时OpenAI的上一任后训练负责人Barret Zoph等人刚刚跟着CTO Mira跑路。 在那一拨人才离职潮中,William (Liam) Fedus是顶上重任的主要角色之一。
3/18/2025 1:14:13 PM
量子位
陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目
大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
3/18/2025 9:19:26 AM
量子位
刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio
OpenAI又痛失一员大将。 刚刚,后训练副总William Fedus官宣离职OpenAI,将创办一家AI发现材料创业公司。 对此OpenAI表示:「OpenAI将会对Fedus新公司进行投资并建立合作伙伴关系」。
3/18/2025 8:58:13 AM
新智元
实战攻略:使用KubeMQ简化多LLM集成流程
译者 | 核子可乐审校 | 重楼将多个大语言模型集成至应用程序当中往往是项艰巨的挑战,各类不同API及通信协议的协同处理,以及如何确保请求路由的复杂性难题往往令人望而生畏。 好在可以使用消息代理与路由机制更优雅地解决此类问题,在解决痛点的同时实现多个关键优势。 本文将向大家介绍具体操作步骤。
3/18/2025 8:00:00 AM
核子可乐
DeepSeek 开源 3FS,一个文件系统而已,有啥值得吹的?
有人说,deepseek一个搞AI的公司,不干正事,开源一个文件系统,有啥值得吹的。 今天来简单聊聊3FS,包懂。 3FS是什么?3FS,Fire-Flyer File System,是一个用C 写的高性能分布式文件系统。
3/18/2025 7:40:00 AM
架构师之路
突发!百川智能两位联合创始人出走,一位正在走离职手续
出品 | 51CTO技术栈(微信号:blog51cto)刚刚收到消息,大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。 其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。 另据知情人士称,焦可和陈炜鹏两人都已经分别开始AI领域的创业。
3/17/2025 3:59:19 PM
2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越
「2025年底,99%的编码将实现AI自动化」! 图片这是OpenAI首席产品官Kevin Weil在最新一期采访中,向全世界发出的郑重宣告。 他大胆预测,今年是人工智能在编程方面,永远超越人类的一年,我们已经没有退路了。
3/17/2025 1:51:06 PM
新智元
一次排查 Cursor Bug 的经历
相信很多同学日常编码已经用上了Cursor。 最近,我在用Cursor过程中遇到了「注册的MCP服务不调用」的问题。 经过一顿排查,最终确定是Cursro自身bug导致。
3/17/2025 10:01:07 AM
卡颂
27个大模型混战电商领域,DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果
全面评估大模型电商领域能力,首个聚焦电商基础概念的可扩展问答基准来了! ChineseEcomQA,来自淘天集团。 此前,大模型常因生成事实性错误信息而受限,而传统基准又难以兼顾电商任务的多样性与领域特殊性。
3/17/2025 8:48:00 AM
量子位
十个让DeepSeek变强大的指令模型
以下是10个AI指令万能公式及对比案例,涵盖不同场景下的应用技巧,帮助大家通过结构化指令提升AI输出质量:1. 角色定位法:明确AI的专家身份错误指令: "写一篇产品营销文案。 " (AI可能生成通用模板,缺乏针对性)正确公式:【角色】 【任务】 【场景】案例: "你是一位10年经验的数码产品营销专家,请为新品智能手表撰写一篇小红书文案,重点突出健康监测功能和商务场景适配性。
3/17/2025 12:22:00 AM
数师兄
技术霸权的真面目:OpenAI游说白宫“放水”,转身对中国AI放火
当全球目光聚焦于人工智能技术竞赛时,OpenAI的“双面游戏”正露出狰狞面目:一边高举“创新自由”大旗游说美国政府放松监管,一边却对中国AI新秀DeepSeek发动围剿。 这种“只许我放火,不许你点灯”的霸权逻辑,撕开了硅谷科技巨头“技术无国界”的虚伪面纱。 “自由创新”是假,垄断利益是真特朗普废除拜登时期AI监管框架后,OpenAI火速向白宫递交“政策建议”,核心诉求直指“宽松监管”和“加速创新”,甚至鼓吹用“自愿合作”取代法律约束,要求美国制定“促进学习自由”的版权政策,将数据掠夺包装成“合理使用”。
3/14/2025 1:17:02 PM
超越ChatGPT:通向AGI的五个最严峻挑战
但像我们这样看着《星际迷航》、《银翼杀手》或《2001太空漫游》长大的人知道,这只是个开始。 与那些虚构世界中的AI,甚至是人类自己相比,今天的AI无法完全探索、交互并从这个世界中学习。 如果它可以做到,就像《星际迷航》中那个非常有用的机器人Data(或一个人类)一样,它可以学会如何解决任何问题或执行任何工作,而不仅仅局限于它最初被训练来做的事情。
3/14/2025 1:12:53 PM
Bernard Marr
谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零
谷歌推出Gemini原生图像生成,测试版瞬间引爆网络。 如果你迟到了,但没有好的借口,甚至还没有出家门——只需要一张自拍,然后让AI把你P到地铁故障现场。 图片也可以凭空生成一个人物形象,把它放到原神游戏画面中(不用上传游戏截图),让角色往前走两步,再把视角往左移,走近一个建筑,开始爬墙。
3/14/2025 12:14:38 PM
ChatGPT再进化:o1支持调用Python分析数据,网友:已经成为Copilot了
今天一大早,ChatGPT突然更新——基于Python的数据分析功能,在o1和o3-mini当中也可以使用了。 OpenAI介绍,现在可以通过两款模型调用Python,完成数据分析、可视化、基于场景的模拟等任务。 量子位实测发现,虽然界面并无明显变化,但是Python的确已经在o1当中悄悄“上岗”了。
3/14/2025 12:14:24 PM
量子位
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构