大模型

陈天奇官宣新APP，让手机原生跑大模型，应用商店直接下载使用

IPhone、iPad 均可体验。

6/5/2023 3:06:00 PM

机器之心

OpenAI、谷歌双标玩得溜：训练大模型用他人数据，却决不允许自身数据外流

你的就是我的，我的还是我的。

6/4/2023 12:35:00 PM

机器之心

5 个章节、25 条规范，全方位 Get 数据集选择与创建的「百科全书」

内容一览：如果你正在学习如何创建或选择一个合适的数据集，那么这篇文章会给你一些实用的建议，帮助你在选择和创建数据集时做出明智的决策。关键词：机器学习数据集

6/2/2023 9:49:00 AM

HyperAI超神经

有证据了，MIT表明：大型语言模型≠随机鹦鹉，确实能学到语义

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息？这一问题在计算机科学和自然语言处理领域一直存在争议。然而，MIT的一项新研究表明，仅基于文本形式训练、用于预测下一个token的语言模型确实能学习和表示文本的意义。

5/22/2023 2:33:00 PM

机器之心

大模型迎来「开源季」，盘点过去一个月那些开源的LLM和数据集

前段时间，谷歌泄露的内部文件表达了这样一个观点，虽然表面看起来 OpenAI 和谷歌在 AI 大模型上你追我赶，但真正的赢家未必会从这两家中产生，因为有一个第三方力量正在悄然崛起。这个力量就是「开源」。

5/16/2023 2:53:00 PM

机器之心

GPT充当大脑，指挥多个模型协作完成各类任务，通用系统AutoML-GPT来了

使用 ChatGPT 实现通用人工智能，思路打开了。

5/15/2023 3:04:00 PM

机器之心

首个单细胞生物学基础大型语言模型，在超1000万个细胞进行预训练

编辑 | 紫罗生成式预训练模型在自然语言处理（NLP）和计算机视觉等领域取得了显著的成功。文本是由文字组成的，细胞可以用基因来表征。NLP 和单细胞生物学之间的另一个核心相似之处是，用于训练的公开可用的单细胞 RNA 测序（scRNA-seq）数据的规模庞大且不断增长。NLP 模型是否也能理解单细胞生物学的内在逻辑并发展「涌现思维」？近日，来自加拿大多伦多大学和彼得·蒙克心脏中心（Peter Munk Cardiac Centre）的研究人员，通过利用呈指数增长的单细胞测序数据，首次尝试对超过 1000 万个细胞进

5/9/2023 11:29:00 AM

ScienceAI

三维ImageNet开源！港中深韩晓光团队助力计算机视觉进入三维大数据时代

随着深度学习技术的快速发展，数据驱动的方法已成为计算机视觉领域的核心。在过去的十年里，随着 ImageNet 诞生之后，计算机视觉领域见证了 “从数据中学习” 的范式的兴盛。在 ImageNet 上进行预训练，然后迁移到下游的视觉任务，都能显著提升模型性能，并且已经成为 2D 图像领域的标准化方式。

5/1/2023 5:12:00 PM

机器之心

平息画师怒火：Stable Diffusion学会在绘画中直接「擦除」侵权概念

Stable Diffusion 学会了「偷天换日」的本领。

4/7/2023 8:46:00 PM

机器之心

探索大语言模型垂直化训练技术和应用-陈运文

内容来源：ChatGPT 及大模型专题研讨会分享嘉宾：达观数据董事长兼CEO 陈运文博士分享主题：《探索大语言模型垂直化训练技术和应用》转载自CSDN稿件本文整理自 3月11日《ChatGPT 及大规模专题研讨会》上，达观数据董事长兼CEO 陈运文博士关于《探索大语言模型垂直化训练技术和应用》的分享，将介绍达观数据在大语言模型应用中的探索与思考。此次分享的主要内容分为 6 块，分别是：参数规模和数据规模的探索垂直领域适应预训练微调技术探索提示工程和垂直优化模型训练加速思路模型功能的垂直效能增强在探索大语言模型

3/23/2023 3:17:00 PM

达观数据

在模型中植入不可检测后门，「外包」AI更易中招

机器学习（ML）正在迎来一个新的时代。

3/21/2023 4:09:00 PM

机器之心

还在为玩不了ChatGPT苦恼？这十几个开源平替也能体验智能对话

本文将为大家盘点一下 ChatGPT 的开源平替项目。

3/19/2023 1:30:00 PM

机器之心

光学算法简化模拟人工智能训练

编辑 | 白菜叶研究人员开发了一系列模拟和其他非常规机器学习系统，期望它们将证明比今天的计算机更节能。但是训练这些人工智能来完成它们的任务一直是一个很大的绊脚石。NTT 设备技术实验室和东京大学的研究人员现在表示，他们已经提出了一种训练算法（NTT 上个月宣布），该算法对让这些系统实现其承诺大有帮助。他们的结果建立在光学模拟计算机上，代表了在获得研究人员长期以来从「非常规」计算机架构中寻求的潜在效率增益方面取得的进展。现代人工智能程序使用一种名为人工神经网络的受生物学启发的架构来执行图像识别或文本生成等任务。控制计

3/15/2023 4:27:00 PM

ScienceAI

腾讯获国际信息检索领域国际权威比赛两项冠军，展示AI大模型技术实力

近日，信息检索领域国际顶级学术会议WSDM（Web Search and Data Mining）宣布了WSDM CUP 2023竞赛成绩，来自腾讯的研究团队基于大模型预训练、搜索排序以及集成学习等技术上的突破，在无偏排序学习和互联网搜索预训练模型赛道上的两项任务中获得冠军，体现了在该领域的领先技术实力。ACM WSDM（Web Search and Data Mining）会议是信息检索领域顶级会议之一，由SIGIR、SIGKDD、SIGMOD和SIGWEB四个专委会协调筹办，在互联网搜索、数据挖掘领域享有较高

3/15/2023 11:38:00 AM

新闻助手

真·ChatGPT平替：无需显卡，MacBook、树莓派就能运行LLaMA

Meta 在上个月末发布了一系列开源大模型 ——LLaMA（Large Language Model Meta AI），参数量从 70 亿到 650 亿不等。由于模型参数量较少，只需单张显卡即可运行，LLaMA 因此被称为 ChatGPT 的平替。发布以来，已有多位开发者尝试在自己的设备上运行 LLaMA 模型，并分享经验。

3/14/2023 2:16:00 PM

机器之心