文章列表
OpenAI 首席产品官:ChatGPT 网页端本周引入高级语音模式
北京时间本周三凌晨,OpenAI 首席产品官凯文·威尔( Kevin Weil )通过 X 平台确认,高级语音模式(Advanced Voice Mode)在本周全面上线ChatGPT网页版,面向付费用户开启。
11/22/2024 9:31:50 PM
清源
腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多
随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。 腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。
11/22/2024 5:23:00 PM
新闻助手
首个可保留情感的音频 LLM:Meta 重磅开源 7B-Spirit LM,一网打尽“音频 + 文本”多模态任务
Meta 开源了一个基础多模态语言模型 Spirit LM,基于一个 70 亿参数的预训练文本语言模型,交错使用文本和语音数据进行训练,使模型能够自由地混合文本和语音,在任一模态中生成语言内容。
11/22/2024 1:04:32 PM
问舟
谷歌 Gemini 突发试验版模型:重回竞技榜第一,新版 GPT-4o 只领先了 1 天
在新版 GPT-4o 刚登顶竞技榜后 1 天,立马发布最新试验版模型 Gemini-Exp-1121 夺回冠军宝座。要知道,一周前上一版模型 Gemini-Exp-1114 才发布。这怕不是拿准了 OpenAI 会来争擂台,故意留了一手。
11/22/2024 12:45:30 PM
汪淼
如何用AIGC快速完成IP延展设计?来看大厂的完整流程!
7亿用户的钉钉,也没有写好的10条产品文案大部分时候,提到产品体验,大家首先会想到产品功能和视觉表现:产品功能是不是满足用户需求,产品界面中的布局、按钮、图标、色彩看起来是不是精妙绝伦。 阅读文章 . 重新认识一下,我叫AI钉三多!
11/22/2024 10:52:30 AM
钉钉设计 团队
写给小白的大模型入门科普
什么是大模型? 大模型,英文名叫Large Model,大型模型。 早期的时候,也叫Foundation Model,基础模型。
11/22/2024 10:45:20 AM
小枣君
为什么AI无法取代设计师?揭秘大厂高手的深度思考!
设计师职场晋升指南(附大厂流程和案例)职场设计师绕不过去的大考——晋升! 阅读文章 . 前言.
11/22/2024 12:39:57 AM
钉钉设计 团队
没有思考过 Embedding,谈何 RAG,更不足以谈 AI大模型
今天,我们来聊聊 AI 大模型,有一个非常重要概念 "Embedding"。 你可能听说过它,也可能对它一知半解。 如果你没有深入了解过 Embedding,那你就无法真正掌握 RAG 技术,更不能掌握 AI 大模型精髓所在。
11/21/2024 3:44:21 PM
渔夫
OpenAI薪酬大曝光!奥特曼身价145亿,年薪只有55万
刚刚,一份新发布的税务申报文件显示,奥特曼去年仅领取了76001美元(约55万人民币)的薪酬。 相比起2022年的73546美元,略有增加。 2022年数据身为OpenAI的CEO,年薪仅为55万。
11/21/2024 1:36:35 PM
新智元
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
DeepSeek 又出手了,这次又是重磅炸弹。 昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。 在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型,有三项成绩还领先于 OpenAI o1-preview。
11/21/2024 1:20:00 PM
机器之心
史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。 近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。 研究人员表示,中文简短问答能够指导开发者更好地理解其模型的中文真实性能力,并促进基础模型的发展。
11/21/2024 12:43:06 PM
收敛速度最高8倍,准确率提升超30%!华科发布MoE Jetpack框架 | NeurIPS 2024
混合专家模型(MoE, Mixture of Experts)是一种通过动态激活网络的部分结构来提升计算效率的架构,可以在保持相对稳定的计算成本的前提下大幅增加参数量,从而有效提升模型性能。 这一特性使得MoE能够兼顾模型的规模与效率,已广泛应用于各种大规模任务。 然而,MoE模型通常需要在大型数据集上预训练以获得理想性能,导致其对时间和计算资源的需求极高,这也限制了其在深度学习社区中的普及性。
11/21/2024 10:21:06 AM
新智元
405B大模型也能线性化!斯坦福MIT最新研究,0.2%训练量让线性注意力提分20+
生产级大模型应用线性注意力的方法,来了。 线性Attention(包括RNN系列),再也不用困在几B参数的范围内娱乐了。 一套方法,即可线性化现有各种量级的Transformer模型,上至Llama 3.1 405B,也只需要十来张显卡在两天内搞定!
11/21/2024 8:39:08 AM
新智元
微调大型语言模型(LLM)的五个技巧
译者 | 李睿审校 | 重楼数据质量、模型架构以及偏见缓解方面的专家建议开发人员可以掌握LLM微调来提高人工智能开发的性能和效率。 为什么微调至关重要大型语言模型(LLM)配备了处理广泛任务的通用能力,包括文本生成、翻译、提取摘要和回答问题。 尽管LLM的性能表现非常强大,但它们在特定的任务导向型问题或特定领域(例如医学和法律等)上仍然效果不佳。
11/21/2024 8:22:45 AM
李睿
神级模型 In-Context LoRA 爆火!10种场景精准出图!
大家好,我是花生~. 阿里通义实验室在月初推出的一个新开源项目 In-Context(上下文) LoRA 最近越来越火了,因为大家发现它实在太好用了,无论是保持人物/场景一致性,还是进行服装、风格、Logo、字体样式、页面版式的学习迁移,效果都非常不错,一下就解决了很多大家之前头疼的问题。 目前 In-Context LoRA 已经在摄影、电商设计、样机制作、头像生成等方面有了落地应用,极大满足了大家对精准控制出图的需求,那今天我们就一起来看看 In-Context LoRA (以下简称 IC LoRA)究竟有哪些神奇之处。
11/21/2024 1:39:32 AM
夏花生
大厂设计复盘!百度法行宝如何打造24小时免费AI律师?
百度「捏合总结」功能设计复盘前言随着 AI 技术的不断进步,用户对于信息获取的即时性、准确性及个性化程度均提出了更高的期望,而对于设计师的挑战则是如何利用设计思维和 AI 技术,帮助用户更高效地获取信息,同时打造出具有智能感知的新功能。 阅读文章 . 前言.
11/21/2024 12:29:27 AM
百度MEUX 团队
推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview
官方表示,该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
11/20/2024 11:02:11 PM
沛霖(实习)
OpenAI 推出免费 AI 培训课程,教老师如何将 ChatGPT 用于教育
OpenAI 与非营利组织 Common Sense Media 共同宣布推出免费的教师培训课程,旨在帮助教师更好地理解人工智能和提示工程(prompt engineering,是指设计和优化提示词以引导大语言模型生成更准确、有用的输出的工程)。
11/20/2024 8:08:10 PM
远洋