理论
大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力
在AI竞速的今天,大语言模型(LLM)早已不满足只在象牙塔里「背书解题」。 当GPT-4o刷题通过物理奥赛、DeepSeek熟练搭建网站之后,LLM必须直面一个更现实的问题:这些号称「专家级」的大模型,能不能真的下工地? 能不能帮工程打工人减负?
7/18/2025 10:08:17 AM
思维链之父跳槽Meta,不只因为1亿美元!离开OpenAI前泄天机
硅谷人才争夺战,火热升级! 过去,是OpenAI从谷歌等公司吸引人才;现在,Meta直接砸钱抢人。 顶尖AI人才的薪酬包可谓天价,1亿美元还是扎克伯格给的起步价!
7/18/2025 10:04:44 AM
刚刚,奥特曼放出ChatGPT「统一智能体」!惊呼真AGI,最卷打工人来了
今晚,ChatGPT和Deep Research、Operator「三剑客」首度合体! 奥特曼亲自带队,25分钟高能直播重磅发布ChatGPT agent,开启人类和智能体协作全新时代。 ChatGPT agent的核心,是一个统一的智能体系统。
7/18/2025 9:59:35 AM
Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍
最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。 他们接连发布了好些个开源模型,覆盖不同的领域,包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。 这样似乎也很难让这位欧洲 AI「新贵」感到满意,他们还想在应用层面好好地卷一卷 OpenAI。
7/18/2025 9:39:57 AM
两位AI传奇预测编程的未来,但你想不到
当你刷着技术动态,忽然看到又一条大胆宣称:“AI将在2026年取代所有程序员。 ”这时,OpenAI联合创始人Andrej Karpathy和亚马逊、谷歌资深工程师Steve Yegge给出了他们的真实预测,结果完全颠覆了这种说法。 他们的观点是:大家都想反了。
7/18/2025 9:35:43 AM
前端小智
人类击败OpenAI守住编程冠军!10小时激战两次反超,AI最后关头功亏一篑
10小时激战! 人类最后关头实现超越,获得编程总决赛冠军~而原本始终保持领先优势的OpenAI,最终屈居第二。 在刚刚落幕的AtCoder世界巡回总决赛上,12名决赛选手两天时间里展开角逐。
7/18/2025 9:28:55 AM
从聊天记录到数字资产:MIRIX 让记忆可买卖
大家好,我是肆〇柒。 当下,LLM 智能体在各种复杂任务中表现得越来越出色。 然而,记忆这一关键要素却始终制约着 LLM 智能体的进一步发展。
7/17/2025 10:08:30 AM
肆零柒
揭秘大模型的魔法:从Transformer架构开始,一步步揭开它的神秘面纱
大家好,我是写代码的中年人,本章我们正式进入Transformer架构的学习。 从 ChatGPT 到文生图,从语音助手到AI绘本的自动生成,背后几乎都躲着一个强大的架构,它像一台“魔法机器”,能读懂语言、生成内容、甚至推理判断。 但这一切魔法的根基,其实都是数学和工程的艺术结晶。
7/17/2025 9:47:07 AM
写代码的中年人
RAG 中文本分块全攻略,这个项目让效率狂飙
在构建 Retrieval-Augmented Generation(RAG)系统时,文本分块作为关键前置环节,其质量直接影响检索精度与生成内容的相关性。 今天给大家推荐一个自己近期整理的项目 ——Awesome-Chunker,一站式聚合并复现了当下主流的文本分块技术,从经典方法到前沿算法应有尽有,助你在 RAG 开发中少走弯路! 1、项目核心价值 让分块不再是难题在 RAG 任务的探索之路上,相信不少研究者都和我一样,为寻找一个能系统提升分块质量的项目而苦恼。
7/17/2025 9:35:26 AM
Goldma
离职员工首次长文揭秘真实的OpenAI:一半是天才,一半是疯子,7周时间上线code x
本文是OpenAI离职员工Calvin French-Owen在OpenAI工作一年的回忆与反思感悟。 作者从OpenAI的企业文化,技术栈揭秘,以及在OpenAI用7天时间打造编程代理code x 的故事,让我们首次得以窥见OpenAI内部,非常值得一看。 我在OpenAI一年的反思与感悟作者:Calvin French-Owen日期:2025年7月15日三周前,我离开了OpenAI。
7/17/2025 9:25:53 AM
“我没错!”GPT-4o嘴硬翻车,AI在黑天鹅事件面前集体宕机
来自哥伦比亚大学、Vector人工智能研究所以及南洋理工大学的一个联合研究团队发现:人工智能模型在处理意外事件时的推理能力存在严重缺陷。 即便是如GPT-4o和Gemini 1.5 Pro这样的顶尖视觉语言模型(VLM),其表现也远逊于人类,差距最高可达32%。 论文地址:《黑天鹅》的研究指出,当前主流的AI评估方式普遍存在一个根本性问题:大多数基准测试围绕“常规模式”构建,也就是说,它们聚焦于可预测、规律清晰的视觉场景。
7/17/2025 7:19:35 AM
大数据文摘
月之暗面开源 Kimi-K2:万亿参数,超强Agent,全线 SOTA
2023年成立的中国AI初创公司月之暗面,刚刚发布了其最新重量级产品Kimi-K2。 这是一款参数规模高达一万亿的开源大模型,以挑战GPT-4.1和Claude Sonnet 4为目标。 Kimi-K2没有配备专门的“推理模块”,却依然在多个关键领域打破性能壁垒,这一策略让人想起早前Deepseek的发布。
7/17/2025 7:12:45 AM
大数据文摘
孤注一掷!小扎本人回应天价挖人策略!顶尖人才更在乎GPU支配权!不是我针对谁,能挖的地方就五六个!可劲造泰坦集群
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)小扎“天价挖人”继续上强度! 今天刚刚爆出重磅消息:OpenAI参与o系列模型研发的两位大神Jason Wei 和 Hyung Won Chung,也被 Meta 一道挖走了! !
7/16/2025 5:32:36 PM
伊风
天塌!OpenAI两位o系列大佬Jason Wei和Hyung Won Chung被曝离职,疑似发推回应:要超越老师,须强化自己
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Meta 化身“人才收割机”的节奏简直停不下来。 此前从 OpenAI、谷歌花天价薪酬挖走了多达 8 位顶尖人才。 现在,那个让我们非常熟悉的、经常在直播宣发中出现的大佬,o 系列模型的两位核心研究人员 Jason Wei 和 Hyung Won Chung,也被 Meta 一道挖走了。
7/16/2025 3:28:52 PM
云昭
OpenAI离职员工自曝:干了一年就润了!007压力逼到极限,AGI成宗教
外界对于OpenAI众说纷纭,很少有人从内部视角描述它的真实文化。 三周前,在推出Codex后,Calvin French-Owen离开了OpenAI。 在2024年5月,他加入了OpenAI,全程见证了OpenAI编程智能体Codex的诞生。
7/16/2025 1:09:46 PM
OpenAI前员工万字爆料刷屏!Codex发布会前紧急部署、已有63 万PR!工程混乱靠自造轮子;建议创始人去AI大厂当螺丝钉!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI 前员工的万字离职帖,在海外技术社区刷屏了! 作者 Calvin French-Owen 把「从初创企业CTO到OpenAI 工程师」的 14 个月,写成了一篇既热血又克制的“内部纪录片”:• 7 周极限冲刺,上线 Codex,上线当天凌晨 4 点还在部署;• 一年扩张几千人,代码库秒变“巨型垃圾场”;• 第一天打开开关,流量就涌进来,“从没见过这么离谱的冷启动”为什么刷屏? 就像作者说得那样:外界关于 OpenAI 的传闻太多,真正从“里面”走出来讲真点一手体验的人太少。
7/16/2025 12:57:50 PM
加拿大丛林迷路五小时,ChatGPT救命神技,比地图还靠谱!
最近,X平台上一个帖子火了,一群人在加拿大偏远的小镇Mabou骑全地形车(ATV)玩,结果迷路了整整五小时,最后靠ChatGPT导航才安全回来。 Mabou是个小地方,周围全是没开发过的森林和小路。 他们本来打算从Upper Southwest Mabou Rd出发,骑18公里到Whycocomagh玩一圈。
7/16/2025 9:58:47 AM
倒反天罡:ChatGPT教人说话?36万视频+77万播客已证实!
AI驯服人类第一步:教人重新说英语? 最近,越来越多的媒体发现:说话的方式,越来越像ChatGPT了! 这不是模仿,而是「入侵」。
7/16/2025 9:52:07 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用