AIGC宇宙 AIGC宇宙

大模型

TypeScript 杀疯了,开发 AI 应用新趋势!

随着 AI 技术的迅猛发展,越来越多开发者开始构建基于大模型(LLM)、多智能体协作、浏览器端推理等新型应用。 在这一浪潮中,TypeScript 凭借其强大的类型系统、成熟的工具链和活跃的生态,正逐步成为现代 AI 应用开发的主流选择之一。 根据 Y Combinator 统计,约有 60% 至 70% 的 AI Agent 初创公司采用 TypeScript 开发。
6/13/2025 11:25:04 AM
CUGGZ

强化预训练(RPT):LLM 预训练新范式,当模型学会战略思考

大家好,我是肆〇柒。 在当下,大型语言模型(LLM)正以其卓越的能力在诸多任务中引人瞩目。 这些能力的提升,很大程度上得益于在大规模文本数据上的 next-token-prediction 自监督学习范式。
6/13/2025 9:29:51 AM
肆零柒

2025上半年大模型领域盘点:创新与争议交织前行

随着大模型的快速迭代,该技术不仅成为了驱动科技发展的重要动力,同时也是推动社会各领域智能化转型的关键力量。 2025年上半年,大模型领域迎来了快速发展与变革。 从DeepSeek发布其推理大模型R1,到百度宣布大模型开源,再到多家厂商纷纷推出大模型一体机,这些事件共同推动了大模型技术在硬件解决方案上的显著进步。
6/13/2025 3:30:00 AM
Yu

谷歌首次增设“首席 AI 架构师”职位,大力加码人工智能战略

谷歌近年来持续整合 DeepMind 与公司整体架构,并试图将其AI技术商业化。不过,尽管行业内技术快速演进,AI仍未为多数公司带来显著回报。与此同时,资本支出却持续攀升。
6/12/2025 11:56:33 AM
清源

简易实用项目攻略:如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户

译者 | 核子可乐审校 | 重楼如今AI虽已全面普及,但多数职场人士仍难以统一运用各类互不相关的工具:一会需要使用聊天机器人、一会需要将文本复制到摘要器内,再加上会议转录和翻译,将本应顺畅的工作流程拆分得零散琐碎。 所以问题来了:为什么不能把各项AI功能集中起来? 为此我决定构建单一Web门户,供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件,甚至从PDF中提取表格等。
6/12/2025 8:24:57 AM
核子可乐

刚刚!OpenAI 上线 o3-pro,性能碾压 Gemini 与 Claude,重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型:o3-pro。   ——这是此前发布的推理模型 o3 的“加强版”。 图片o3-pro属于“推理模型”,它可以一步步拆解问题、逻辑严密地得出结论。
6/11/2025 2:48:11 PM

小红书开源首个 AI 文本大模型:11.2T 精炼语料吊打海量数据,证明“大模型≠大数据”

近日,在中文开源大模型愈发稀缺的背景下,小红书旗下 hi lab 公布了中等规模的 MoE 模型 dots.llm1,以 1420 亿总参数、每次仅激活 140 亿参数的设计,达成与 Qwen2.5-72B 相近的性能,吸引了社区的关注。 图片据悉,dots.llm1 是一个 Mixture of Experts(MoE)结构的语言模型。 尽管总参数规模达 142B,但在每次推理中只激活 14B,有效控制了计算开销。
6/11/2025 2:44:48 PM

o3 pro一手真体验!上下文喂到断供!大神:o3 pro不会聊天,上帝渴望上下文,认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了 5 月份的“买买买”的节奏之后,6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。 今天凌晨,Sam Altman 动作非常密集。 先是宣布 o3 价格“截肢”(价格直接降至 1/5 ),紧接着不到 2 小时后就发布了 o3-pro。
6/11/2025 12:44:40 PM
云昭

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出,表象下藏着认知危机:即使生成合规答案,超60%的案例中模型并未真正理解风险。 换句话说,主流推理模型的安全性能存在系统性漏洞。 针对此种现象,淘天集团算法技术-未来实验室团队引入「表面安全对齐」(Superficial Safety Alignment, SSA)这一术语来描述这种系统性漏洞。
6/10/2025 11:25:06 AM

DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注

据虎嗅消息,国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业,并计划在2025年圣诞节前后推出其首款Agent产品。 有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。 该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。
6/10/2025 10:00:32 AM
AI在线

七种方式让你的AI编码结果更靠谱

译者 | 核子可乐审校 | 重楼企业在积极引入AI的同时,也希望雇用更多工程师,期望开发者能够借AI之力将产出“提升10倍”。 但要真正高效运用AI编码助手,其中也有不少门道。 首先是AI编码助手的固有局限,其存在大量不确定性,因此容易引发种种难以避免的意外行为,例如随机删除代码或引入逻辑错误。
6/10/2025 8:30:50 AM
核子可乐

多模态推理模型(LMRM):从感知到推理的演变

大家好,我是肆〇柒。 当下,人工智能正以前所未有的速度改变着我们的生活与工作方式。 其中,推理作为人工智能的核心能力之一,赋予了智能体在复杂环境中做出决策、得出结论以及进行知识泛化的能力。
6/10/2025 3:30:00 AM
肆零柒

高考作文“抽象”上热搜,大模型来战能拿几分?

6月7日上午,2025年全国高考正式拉开帷幕。 首场语文考试结束后,作文题目便迅速成为众人讨论的焦点。 有网友表示,今年的高考作文太难了,甚至是有些抽象。
6/9/2025 3:23:26 PM
Yu

​谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足

自2025年4月底以来,谷歌的 Gemini 应用在全球 Android 下载量上超过了 ChatGPT,每周的安装量达到了600万以上。 然而,ChatGPT 在同一时期的下载量则下降到了300万以下。 这一变化可能得益于谷歌通过其搜索引擎及其他服务的广泛推广,从而为 Gemini 吸引了大量用户。
6/9/2025 11:01:00 AM
AI在线

六大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底

又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。 考试一结束,「高考数学」、「新一卷数学大题 难」等词条就火速冲上微博热搜,考生们在评论区集体「哀嚎」:「大题写到怀疑人生」、「选择填空送分,大题送命」。
6/8/2025 12:23:06 PM
机器之心

每天自动获取日历邮件摘要:谷歌 Gemini 安卓版应用新增“Scheduled Actions”功能

谷歌Gemini安卓版应用新增“计划操作”功能,支持预设指令自动执行任务,如获取日历邮件摘要、生成小说大纲等。即日起向Google AI Pro/Ultra会员开放。#谷歌Gemini# #自动化任务#
6/7/2025 9:34:56 AM
漾仔

谷歌 Gemini 上线“计划操作”功能:动动手就能让“AI 秘书”帮你完成任务

“计划操作”目前仅向订阅 Gemini 付费服务的用户开放,包括 Google AI Pro、Ultra,以及 Google Workspace 的商业和教育版用户。
6/7/2025 8:35:43 AM
清源

Dify工具插件开发和智能体开发全流程实战

前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 Dify自1.0.0引入全新插件化架构,模型(Models)与工具(Tools)迁移为插件(Plugins),引入 Agent 策略(Agent Strategies)、扩展(Extensions)类型插件和插件集(Bundles)。 通过全新的插件机制,能够增强 AI 应用的感知和执行能力,拓宽AI在软件操作领域的应用能力。
6/6/2025 10:01:25 AM
AI大模型应用开发