文章列表
大模型的基石:LLM预训练全解析
前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM
AI大模型应用开发
OpenAI重大发现:GPT-4b micro改造诺奖研究,山中因子重编程效率提高50倍
AI 加速科学和药物研发,已经不是什么新鲜事,但它的潜力远未被完全释放。 就在刚刚过去的一天,OpenAI 宣布他们与生物科技初创公司 Retro Bio 合作,研发的新模型 GPT-4b micro,设计出了新型且显著增强的山中因子变体。 山中因子是一组蛋白质,由诺奖得主、日本科学家山中伸弥在 2006 年提出,其包括 Oct4、Sox2、Klf4 和 c - Myc4 种因子,又称 OSKM。
8/23/2025 7:28:00 PM
机器之心
OpenAI首个蛋白质模型披露更多细节,改进诺奖研究成果,表达量提升50倍
GPT-4o蛋白质专用版,已成功改进诺贝尔奖获奖蛋白的变体。 科学家利用GPT‑4b micro成功设计了新型且显著增强的山中伸弥因子变体,将干细胞重编程标记物的表达量提升了50倍。 重新设计的蛋白质还表现出增强的DNA损伤修复能力。
8/23/2025 1:56:44 PM
不圆
DeepSeek V3.1:低调发布,重磅发声
译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM
李睿
如果有一个能替你操作手机的Agent,你会用它做什么?
往期作者干货:如果你有一个能替你操作手机的 Agent,你会用它来做什么? 替自己回复微信消息? 下单中午想吃的外卖?
8/23/2025 12:28:55 AM
一泽Eze
特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级
AIbase报道 特斯拉正为其车辆语音助手功能引入更强AI能力。 根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。 双重AI技术加持智能交互条款内容显示,特斯拉语音助手将得到火山引擎提供的Doubao大模型(云雀大模型)和DeepSeek Chat的技术支持。
8/22/2025 6:21:26 PM
AI在线
OpenAI头号叛徒,竟然是自学的AI?
6个月自学速成AI,我成为了LLM天才❛‿˂̵✧. 成就OpenAI、打倒OpenAI(咳咳)创立对家Anthropic,从此化身前司的心腹大患……嘿! 这还真就是Anthropic联合创始人Tom Brown自个儿分享的AI奋斗史。
8/22/2025 4:09:43 PM
鹭羽
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM
OpenAI 正式进驻印度,计划在新德里设立办公室
近日,OpenAI 宣布将正式进军印度市场,并计划在新德里开设一间新的办公室。 这一消息意味着 OpenAI 在全球范围内的扩展策略再度加速,标志着其对印度这一关键市场的重视。 随着人工智能技术的快速发展,印度的市场潜力吸引了众多科技公司的目光,OpenAI 作为人工智能领域的领军者,自然不愿错过这个机会。
8/22/2025 2:46:23 PM
AI在线
三观碎了!老鸟自曝某AI初创奇葩工作经历:代码全靠ChatGPT拼接,脚本命名憋笑,高危慎入!创始人:技术栈主要是OpenAI
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)太狗血了! 劝各位,如果正在找AI方面的工作,可得擦亮眼睛了! 今天,小编碰到了一个荒诞得有点狗血的真实故事。
8/22/2025 2:12:21 PM
云昭
谷歌Gemini一次提示能耗≈看9秒电视,专家:别太信,有误导性
谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。 博客地址::,处理一个中位数的 Gemini 文本提示仅消耗约 0.26 毫升水(约五滴)、0.24 瓦时电力(相当于观看电视不到九秒),并产生 0.03 克二氧化碳排放。 注:中位数(Median)是统计学中用于描述数据集中趋势的指标之一。
8/22/2025 1:54:00 PM
机器之心
究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片
软件 硬件的全链路国产 AI 体系来了? 这几天,不论国内国外,人们都在关注 DeepSeek 发布的 V3.1 新模型。 它采用了全新的混合推理架构,让模型能在一个统一框架内支持「思考」与「非思考」两种模式。
8/22/2025 1:42:00 PM
机器之心
谷歌为美国政府提供 Gemini 人工智能工具,助力数字化转型
谷歌近期宣布,将向美国联邦机构提供其最新的 Gemini 人工智能工具,几乎是以零费用的形式供给。 这一消息是在美国总务管理局(GSA)的一份联合声明中公布的,目的是加速政府对人工智能技术的采用。 谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案,帮助他们实现重要的使命。
8/22/2025 1:33:53 PM
AI在线
马斯克与扎克伯格密谋收购 OpenAI?Meta 被要求提供证据
根据最新报道,OpenAI 正在调查 Meta 是否参与了埃隆・马斯克对该公司的970亿美元收购提案。 OpenAI 的律师在马斯克针对其提起的诉讼中,向 Meta 发出了传票,要求其提供与马斯克及其新成立的人工智能公司 xAI 有关的任何协作或投资计划的证据。 图源备注:图片由AI生成,图片授权服务商Midjourney马斯克于2月份提出了这一收购提案,并且据称他与 Meta 首席执行官马克・扎克伯格就此事进行了沟通,包括探讨潜在的融资安排。
8/22/2025 1:33:52 PM
AI在线
DeepSeek:世子之争,不过如此
最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun
全球95%企业AI惨败?MIT报告引硅谷恐慌!90%员工偷用ChatGPT续命
全球95%企业AI惨败? MIT报告引硅谷恐慌! 90%员工偷用ChatGPT续命全球95%搞AI项目的公司,基本都凉了!
8/22/2025 1:09:38 PM
新智元
71% 的美国人忧虑 AI 将永久性失业
根据最新的 Reuters 与 Ipsos 联合调查,超过70% 的美国成年人对人工智能(AI)可能导致的工作岗位消失感到担忧。 这项调查共访问了4,446名美国成年人,结果显示,71% 的受访者表示,他们担心 AI 会 “永久性” 取代大量美国工人的工作。 与此同时,微软的一份研究报告也指出了最有可能被 AI 自动化的职位,信息处理和沟通相关的角色,如翻译和客户服务代表,位列其中。
8/22/2025 10:54:48 AM
AI在线
专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述
Google 近期发布了一篇关于人工智能对环境影响的研究论文,指出现有的测量方式过于狭隘,提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。 这项研究声称,Gemini 在处理文本提示时,仅消耗0.26毫升的水,相当于五滴水,同时消耗0.24Wh 的能量,产生0.03克的二氧化碳当量。 Google 表示,在2024年5月至2025年5月期间,其每次排放总量已经减少了44倍。
8/22/2025 10:54:48 AM
AI在线