推理

DeepSeek R1 遇难题 142 次 "I give up"，研究还称需增加推理时机控制机制

Cursor 刚刚参与了一项研究，他们基于 NPR 周日谜题挑战（The Sunday Puzzle），构建了一个包含近 600 个问题新基准测试。

2/14/2025 12:57:55 PM

清源

OpenAI 升级 o3-mini 模型思维链，提高 AI 推理透明度

OpenAI 公司今天（2 月 7 日）在 X 平台发布推文，宣布面向免费和付费用户更新 o3-mini 的思维链，并为付费用户更新 o3-mini-high 的思维链，更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。

2/7/2025 7:20:02 AM

故渊

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

近日，中国电信人工智能研究院（TeleAI）“复杂推理大模型” TeleAI-t1-preview 正式发布，即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。早在 1500 多年前，数学家祖冲之就曾在《辩戴法兴难新历》中指出，复杂事物的运行规律并非超自然现象，而是可以通过实际观测、数据推理而严谨求得。

1/26/2025 9:41:00 AM

新闻助手

资讯热榜

最强OCR竟然不是DeepSeek、Paddle！HuggingFace新作：六大顶尖开源OCR模型横评！继DS后又杀出匹黑马！如何把ChatGPT嵌入到自己的应用中？ ChatGPT 涉嫌“诱导”美国 16 岁少年自杀，家属指控 OpenAI 事发前放松安全措施微软AI主管苏莱曼:微软不会开发情色类AI，与OpenAI划清界限消息称软银批准对 OpenAI 追加 225 亿美元投资，助力未来上市 OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务谷歌地球整合 Gemini，大模型加持可识别风暴与干旱风险全网刷屏的「电影感」三宫格图片，教你用AI快速生成！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人大模型数据 Midjourney 开源 Meta 智能微软用户 AI新词 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果腾讯 Stable Diffusion Claude 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人研究 AI视频生成大语言模型具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉预测 Transformer AI模型伟达亚马逊 MCP