大模型
三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持
三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby,但这是三星首次确认相关消息,并透露了大致发布时
7/11/2024 3:59:02 PM
远洋
Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI
编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型 (LLM),因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能,重点关注两个关键应用:分子特性预测和药物-药物相互作用预测。该研究以「Can
7/11/2024 11:51:00 AM
ScienceAI
LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程
编辑 | ScienceAI终于,半导体设计行业有了专属的开源大模型!7 月 9 日,国外公司 Aitomatic 宣布推出「Semi Kong」,这是世界上首个专为半导体行业设计的开源 AI 大型语言模型(LLM)。SemiKong 在 2024 年 Semicon West 展会上亮相,旨在彻底改变半导体工艺和制造技术,并有可能在未来五年内重塑价值 5000 亿美元的半导体行业。图示:LeCun 在 X 转发了 SemiKong 内容。(来源:X)Yann LeCun 在 X 转发了这条激动人心的内容:「这是专
7/10/2024 2:53:00 PM
ScienceAI
AI文档搜索公司Hebbia完成1.3亿美元融资,a16z领投;奥特曼成立AI健康公司;大模型最强架构TTT问世丨AI情报局
融资快报Hebbia 完成 1.3 亿美元融资:位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资,由 a16z 领投,Index Ventures、Google Ventures 以及 Peter Thiel 参投。 据悉,Hebbia 目前估值约为 7 亿美元,公司成立于 2020 年,其软件可分析数字化文档和数据源,包括监管文件、PDF 以及音频和视频剪辑,以帮助客户处理比面向消费者的聊天机器人更复杂的查询,类似 Glean。 旷视科技MEGVII上交所提交注册:旷视科技MEGVII以自研视觉感知算法引擎为核心,致力于持续打造在各商业领域的 AIoT 操作系统,以及深度构建具备连接百亿物联网设备能力的生态系统,为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。
7/10/2024 11:48:00 AM
我在思考中
又遇到「GPT写的review」了?看看北大&密歇根的这个研究工作
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文是对发表在计算经济学顶级会议ACM Conference on Economics and Computation (EC'24)上的论文Eliciting Informative T
7/10/2024 11:27:00 AM
机器之心
港大马毅:现在的大模型只有「知识」,没有「智能」
导语:知识与智能是两个概念。 访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law(规模定律)作为信仰并投身其中时,马毅却选择了一条少有人走的路。 「模型无所谓大小,我们说正确的模型,主要看机制是否正确,这才是智能的本质。
7/9/2024 3:31:00 PM
马蕊蕾
开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布
作者 | 上海交通大学、上海人工智能实验室编辑 | ScienceAI近日,上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT(Segment Anything in radiology scans, driven by Text prompts),在3D医学图像(CT、MR、PET)上,基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。论文链接:::、手术规划和疾病监测等一系列临床任务中都有重要作用。然而,传统的研究针对每个特定的分割任务训练「专用」模型,导致
7/9/2024 1:41:00 PM
ScienceAI
北大千问团队推出数学专用版 CriticGPT,“找茬”让大模型进步更快
批评不仅能让人进步,也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在 CriticGPT 放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上,它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注,然后用得到的数据训练出
7/8/2024 11:30:24 PM
清源
Anthropic 首席执行官:未来三年内,AI 大模型训练成本将上升至百亿甚至千亿美元
据 Tom's Hardware 今日报道,AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示,目前像 GPT-4o 这样的模型训练成本约为 1 亿美元,而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元(AI在线备注:当前约 72.94 亿元人民币)。当然,10 亿美元还不是“终点”。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元(当前约 7294.28 亿元人民币)。Dario A
7/8/2024 3:58:29 PM
清源
启明创投发布2024生成式AI十大展望
7月6日,由启明创投主办的2024世界人工智能大会(WAIC)“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”在上海世博中心红厅成功举办。 大语言模型、多模态模型、具身智能和生成式AI应用领域的著名专家与学者,顶尖投资人和领军创业者汇聚一堂,围绕生成式AI基础技术进展、商业应用前景和创业投资生态等主题展开分享与交流。 启明创投从2013年开始系统性布局人工智能领域,从AI 1.0到AI 2.0,经过十余年的深耕与前沿洞察,启明创投在AI领域投资了众多项目,多家上市或成长为独角兽企业。
7/7/2024 10:48:00 PM
晓楠
100天后,阶跃星辰交出了第二份答卷
今年 3 月,「借着」 2024 全球开发者先锋大会的场子,「国内最后一家通用大模型公司」——阶跃星辰发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版,正式进入大众视野,并成功跻身国内六大大模型独角兽行列。 另外五家分别是月之暗面、智谱、MiniMax、百川、零一万物。 当然,这一份成绩很是亮眼,一举将国内大模型卷到万亿参数赛道(预览版)。
7/5/2024 9:29:00 PM
晓楠
无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业
7月4日,可信大模型公司无限光年(INF)在2024年世界人工智能大会(WAIC)上发布可信光语大模型及其技术报告。 可信光语大模型结合大语言模型与符号推理,有效解决幻觉问题,大幅增强模型可信度,赋能金融服务、医疗诊断等垂直领域,让生成式AI真正成为新质生产力工具。 在“人工智能:科研范式变革与产业发展”主题论坛上,无限光年联合创始人徐盈辉博士表示,幻觉问题是大模型被用作生产力工具的核心挑战之一:如果大模型生成的内容不可控、难以解释,就很难满足专业领域对准确性、可靠性、严谨性的要求。
7/5/2024 2:30:00 PM
晓楠
13瓦功耗处理10亿参数,接近大脑效率,消除LLM中的矩阵乘法来颠覆AI现状
编辑 | 萝卜皮通常,矩阵乘法 (MatMul) 在大型语言模型(LLM)总体计算成本中占据主导地位。随着 LLM 扩展到更大的嵌入维度和上下文长度,这方面的成本只会增加。加州大学、LuxiTech 和苏州大学的研究人员声称开发出一种新方法,通过消除过程中的矩阵乘法来更有效地运行人工智能语言模型。这从根本上重新设计了目前由 GPU 芯片加速的神经网络操作方式。研究人员描述了如何在不使用 MatMul 的情况下创建一个自定义的 27 亿参数模型,性能与当前最先进的 Transformer 模型相当。该研究以「Scal
7/4/2024 3:42:00 PM
ScienceAI
巴西政府机构出手,禁止 Meta 公司使用用户数据训练生成式 AI 模型
感谢据美联社报道,巴西国家数据保护局当地时间周二(2 日)认定,拥有 Facebook、Instagram、WhatsApp 等平台的社交网络巨头 Meta 将不得使用来自巴西的数据来训练其生成式 AI 模型。Meta 近期更新了隐私政策,允许公司可将人们的公开帖子用于训练其模型。根据巴西国家数据保护局的公报,Meta 此举将会对受影响数据主体的基本权利造成严重的、不可挽回的或难以修复的损害,此次下达的禁令是“预防性措施”。巴西是 Meta 的最大市场之一。在该国 2.03 亿的总人口(IT之家注:数据来自 202
7/3/2024 7:16:46 PM
清源
亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践
以大模型为代表的新一代人工智能技术变革仍在加速迭代,为“新质生产力”的发展注入强劲动力,助力产业智能化升级和经济发展。 目前,大模型在产业端,已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景渗透,这个趋势既得益于基础技术的提升与创新实践的探索,也进一步推动着技术变革与实践深化。 由世界人工智能大会组委会办公室指导,新一代人工智能产业技术创新战略联盟(AITISA)主办,蚂蚁集团承办的“可信大模型助力产业创新发展论坛”,将于7月5日在上海·世博中心金厅举行。
7/2/2024 12:04:00 PM
我在思考中
从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定
很翔实的一篇教程。OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及许多其他已经发布或未来将出现的文本生成视频模型,是继大语言模型 (LLM) 之后 2024 年最流行的 AI 趋势之一。在这篇博客中,作者将展示如何将从头开始构建一个小规模的文本生成视频模型,涵盖了从理解理论概念、到编写整个架构再到生成最终结果的所有内容。由于作者没有大算力的 GPU,所以仅编写了小规模架构。以下是在不同处理器上训练模型所需时间的比较。作者表示,在 CPU 上运行显然需要更长
7/1/2024 5:22:00 PM
机器之心
击败25个分子设计算法,佐治亚理工、多伦多大学、康奈尔提出大语言模型MOLLEO
作者 | 佐治亚理工学院王浩瑞编辑 | ScienceAI分子发现作为优化问题,因其优化目标可能不可微分而带来显著的计算挑战。进化算法(EAs)常用于优化分子发现中的黑箱目标,通过随机突变和交叉来遍历化学空间,但这会导致大量昂贵的目标评估。在这项工作中,佐治亚理工学院、多伦多大学和康奈尔大学研究者合作提出了分子语言增强进化优化(MOLLEO),通过将拥有化学知识的预训练大语言模型(LLMs)整合到进化算法中,显著改善了进化算法的分子优化能力。该研究以《Efficient Evolutionary Search Ov
7/1/2024 4:14:00 PM
ScienceAI
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉