论文

两岁的Llama，最初的14位作者已跑了11个！Mistral成最大赢家

Meta 开源 Llama 模型家族帮助该公司制定了 AI 战略，某种程度上也改变了全世界的大模型格局。然而，令人意想不到的是，短短几年，Llama 的初创者们大多已经转投他处。在 2023 年发表的那篇具有里程碑意义的论文《 LLaMA: Open and Efficient Foundation Language Models 》中，Llama 被推向世界，当时论文共有 14 位作者。

5/27/2025 3:37:46 PM

DeepSeek发布大模型训练端到端论文，展示卓越工程深度

近日，DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文，引发业界广泛关注。该论文全面阐述了DeepSeek在大模型研发中的技术突破，涵盖软件、硬件及混合优化方案，展现了其令人惊叹的工程深度。在**软件**层面，论文详细介绍了多头潜在注意力机制（MLA），显著降低推理过程中的内存占用;FP8混合精度训练通过低精度计算提升效率，同时保证数值稳定性;DeepEP通信库优化了专家并行(EP)通信，支持FP8低精度操作，加速MoE模型训练与推理;LogFMT对数浮点格式则通过均匀化激活分布，进一步优化计算效率。

5/21/2025 11:01:05 AM

AI在线

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

当地时间2月25日，AAAI 2025 在美国宾夕法尼亚州费城举办，会议为期8天，于3月4日结束。 AAAI 由国际人工智能促进协会主办，是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的A类国际学术会议，每年举办一届。 AAAI 2025 共有12957篇有效投稿，录用3032篇，录取率为 23.4%。

2/27/2025 10:28:00 AM

新闻助手

o1 pro深评博士医学论文，震惊顶尖免疫学家！2分破解神秘作家身份

圣诞马拉松的第一天，OpenAI对外发布了o1 pro。近乎全网都震惊于o1 pro高达博士水平的数学、科学、编程能力。最近，OpenAI总裁Greg Brockman在X上转发了世界顶尖免疫学专家Derya Unutmaz的帖子。

12/30/2024 11:00:00 AM

新智元

Nature 曝惊人内幕：论文被天价卖出喂 AI，作者 0 收入

Nature 的一篇文章透露：你发过的 paper，很可能已经被拿去训练模型了！有的出版商靠卖数据，已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗？全球数据告急，怎么办？论文来凑！最近，Nature 的一篇文章向我们揭露了这样一个事实：连科研论文，都被薅去训 AI 了……据悉，很多学术出版商，已经向科技公司授权访问自家的论文，用来训练 AI 模型。一篇论文从酝酿 idea 到成稿，包含了多少作者日日夜夜的心血，如今很可能在不知情的情况下，就成为训 AI 的数据。这合理吗？更可气的是

8/15/2024 12:53:16 PM

汪淼

2024智源大会议程公开丨大语言模型

2024年6月14日-15日，第6届北京智源大会将以线下与线上结合的形式召开，线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野，汇聚年度杰出工作研究者，交流新思想，探讨新思路，引领新前沿。目前已正式开放报名渠道。大语言模型论坛丨6月14日下午近年来，大语言模型取得了重要的技术进展，成为了人工智能领域最受社会关注的研究方向之一，其应用范围逐渐覆盖了信息产业的多个领域。对其底层原理与训练方法的探索也成为了学术界与工业界的共同关注焦点。本次论坛针对大语言模型相关的基础问题展开相关探讨，主要包

6/4/2024 3:49:00 PM

新闻助手

GPT-4 整治学术不端：人大 / 浙大团队实测 7000 篇论文，撤稿预测与人类 95% 一致

【新智元导读】人大与浙大学者发现，GPT-4 对于论文给出的撤稿预测结果，竟然和人类审稿人有将近 95% 的相似性。看来大模型虽然有可能引发学术不端，但也有办法维护科研诚信啊。学术论文的撤稿事件时有发生，这不仅损害了科研诚信，也可能对公众信任和科学进展产生负面影响。传统上，学术界依赖同行评审和出版后的读者反馈来识别和纠正问题论文，但这些方法可能无法及时发现所有问题，尤其是在当前科研论文出版数量急剧增加的背景下。在这种情况下，如何快速识别存在问题的论文，并促进它们的撤稿，成了学术界亟待解决的一个难题。最近，来自中国人

4/15/2024 12:46:16 PM

清源

ChatGPT 也在评审你的顶会投稿，斯坦福新研究捅了马蜂窝

尴了个大尬！人们还在嘲讽有人用 ChatGPT 写论文忘了删掉“狐狸尾巴”，另一边审稿人也被曝出用 ChatGPT 写同行评论了。而且，还是来自 ICLR、NeurIPS 等顶会的那种。来自斯坦福的学者对一些顶级 AI 会议（如 ICLR、NeurIPS、CoRL 等）中的审稿意见进行了分析，结果发现 ——在 ChatGPT 出现之后，这些同行评论的“AI 含量”大增，最多的高达 16.9%，而有 ChatGPT 之前这个比例大约是 2%。证据也很直观，AI 常用的词汇出现频率，在 ChatGPT 发布之后噌的一下

4/2/2024 5:44:14 PM

汪淼