文章列表

分类

标签

当AI创造AI，就是库兹韦尔「奇点」临近时？人类正处于自我改进AI爆炸边缘

让AI自我改进这件事，究竟靠谱不靠谱？伴随着深度学习技术的深入，特别是OpenAI正式发布生成式对话大模型ChatGPT之后，其强大的AI发展潜力让研究学者们也开始进一步猜想AI的现实潜力。于是，在自我改进AI这件事上，研究学者们也是费了不少心思。

11/28/2024 7:14:20 PM

新智元

OpenAI API：LLM编程的事实标准

当下，大模型领域已然步入 “百模大战” 时期，形形色色的大模型如雨后春笋般不断涌现。那么，若我们打算学习大模型的 API，是否真的需要逐一去钻研呢？答案无疑是否定的。

11/28/2024 4:45:50 PM

greencoatman

官宣开源阿里云与清华大学共建AI大模型推理项目Mooncake

2024年6月，国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室（Machine Learning, AI, Big Data Systems Lab）联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。通过使用以 KVCache 为中心的 PD 分离和以存换算架构，大幅提升大模型应用Kimi智能助手推理吞吐的同时有效降低了推理成本，自发布以来受到业界广泛关注。近日，清华大学和研究组织9#AISoft，联合以阿里云为代表的多家企业和研究机构，正式开源大模型资源池化项目 Mooncake。

11/28/2024 3:51:00 PM

新闻助手

马斯克旗下xAI蓄势待发，拟推独立App正面挑战ChatGPT

人工智能领域波澜再起，特斯拉及SpaceX创始人埃隆·马斯克旗下的AI初创公司xAI宣布即将推出一款与当前市场热门产品ChatGPT相抗衡的聊天机器人应用，预计最早将于今年12月面世。这一动作不仅标志着xAI正式踏入消费级市场，也直接对老东家、曾由马斯克联合创立的OpenAI发出了挑战信号。据国外媒体报道，xAI的这一新应用将是其首个面向消费者的产品，此前，xAI的技术主要应用于X平台(前身为Twitter)等内部项目中的Grok应用。

11/28/2024 2:46:00 PM

晓晓

上海AI实验室版o1已上线！数学竞赛题、Leetcode赛题全拿下，还会玩24点

国产o1新选手登场！它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！

11/28/2024 1:40:00 PM

量子位

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

本次开源将采用分阶段的方式，逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现，同时针对各类推理引擎和底层存储 / 传输资源进行兼容。

11/28/2024 1:06:19 PM

汪淼

标记化在LLM中有怎样的重要作用？

译者 | 李睿审校 | 重楼如今，GPT-3、GPT-4或谷歌的BERT等大型语言模型（LLM）已经成为人工智能理解和处理人类语言的重要组成部分。但在这些模型展现出令人印象深刻的能力背后，却隐藏着一个很容易被忽视的过程：标记化。本文将解释标记化的定义，标记化如此重要的原因，以及在实际应用中是否能够规避这一步骤。

11/28/2024 8:15:44 AM

李睿

ComfyUI V1 桌面客户端终于来啦！支持 Mac/Win 一键安装（附安装包和使用指南）

大家好，我是花生~. 10 月底的时候 ComfyUI 官方宣布将发布一款桌面客户端，它最大的特点是同时兼容 Mac 和 Windows 系统，也就是说苹果用户也可以实现一键安装 ComfyUI 了，很多小伙伴最担心的安装问题迎刃而解。当时我也申请了内测名额，并在半个月前就收到了官方发送的内测邮件，但那时只有 windows 安装包一项，而且初始版本并不稳定，所以没有第一时间为大家介绍。

11/28/2024 5:34:43 AM

夏花生

AIGC喂饭教程！如何快速生成3款感恩节运营海报？

哈啰大家好，好久不见啦~~这里是和你一起探索 AIGC 美学边界的戏呱皮 DC。大家可以叫我呱呱。前几天呱呱出了一篇《AIGC 喂饭教程！

11/28/2024 12:31:35 AM

戏呱皮DC

被曝入局浏览器市场后，OpenAI 将前谷歌 Chrome 工程师纳入麾下

综合鞭牛士、Search Engine Journal等26日消息，前谷歌Chrome浏览器工程师达林·费舍尔（Darin Fisher）近期加入了OpenAI。

11/27/2024 10:09:28 PM

清源

LLM应用开发者新利好：再也不用写集成代码了！

编辑 | 言征进入今年以来，如何磕破头也要挤进大LLM应用的赛道成为了每一位开发者的心事。但上车LLM应用的人都知道，基于大模型做开发，远没有外界所说的“调接口”那么简单，开发人的痛，没人懂。比如，光定制代码就能把你搞到没脾气。

11/27/2024 2:30:46 PM

言征

1行代码改进大模型训练，Llama训练速度提升至1.47倍，全华人团队出品

只要改一行代码，就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者，提出了大模型训练优化器Cautious Optimizers。在提速的同时，Cautious能够保证训练效果不出现损失，而且语言和视觉模型都适用。

11/27/2024 2:30:00 PM

量子位

遗憾不？原来百度2017年就研究过Scaling Law，连Anthropic CEO灵感都来自百度

在追求 AGI 的道路上，Scaling Law 是绕不开的一环。如果 Scaling Law 撞到了天花板，扩大模型规模，增加算力不能大幅提升模型的能力，那么就需要探索新的架构创新、算法优化或跨领域的技术突破。作为一个学术概念，Scaling Law 为人所熟知，通常归功于 OpenAI 在 2020 年发的这篇论文：论文标题：Scaling Laws for Neural Language Models论文链接：、数据量、计算资源增加而指数提升。

11/27/2024 1:40:00 PM

机器之心

Sora就这么泄露了三小时，网友调侃Altman急拔网线，艺术家们也在抗议被「白嫖」

一觉醒来，挺突然的，Sora API 就这么泄露了。坏消息：三个小时后，OpenAI 就关闭了访问权限。好消息：大家伙把该测的都测完了。

11/27/2024 10:40:00 AM

机器之心

提示工程：更好地释放LLM的能力

提示工程，正如其名，主要聚焦于探究如何创作提示词。存在提示工程的一个关键缘由在于，大模型在不同人群的视角下所发挥的作用差异显著。普通使用者往往仅将大模型视作聊天机器人，他们着重关注的是大模型能否迅速且精准地予以反馈。

11/27/2024 10:23:31 AM

greencoatman

10 秒 1080P：部分艺术家指控 OpenAI 压榨，怒而泄露 Sora 视频生成 AI 模型

科技媒体 TechCrunch 昨日（11 月 26 日）发布博文，报道称名为“Sora PR Puppets”的组织为抗议 OpenAI 的“欺骗行为”和“艺术洗白”，于本周二在 Hugging Face 平台泄露了对 OpenAI 视频生成模型 Sora 的访问权限。

11/27/2024 8:28:53 AM

故渊

DreamMachine 全面升级！支持图像生成，7 大功打造全新体验

大家好，我是花生~. 之前为大家介绍过一款 AI 视频生成工具 DreamMachine，它由知名 AI 科技公司 Luma AI 推出，可以将图像转为动态视频，而且尤其擅长实现两张不同的图像间的流畅转换，很适合用来制作创意转场。相关推荐：.

11/27/2024 8:26:22 AM

夏花生

如何借助Cortex运行本地LLM

译者 | 布加迪审校 | 重楼AI行业正在经历一场转变，转向更小巧更高效的大语言模型（LLM），从而使用户能够在本地机器上运行模型，无需功能强大的服务器。本教程将指导你借助Cortex运行本地LLM，着重介绍其独特的功能和易用性，使任何拥有标准硬件的人都可以享用AI。注意：Cortex目前正在积极开发中，这可能会导致bug或某些功能无法正常运行。

11/27/2024 8:14:43 AM

布加迪

资讯热榜

OpenAI发布企业AI浪潮领先指南：十大核心洞察华纳兄弟发起 “反击战”：起诉AI图像生成公司Midjourney OpenAI 挥剑指向 LinkedIn，将于2026年推出 AI 招聘平台谷歌新 AI “Nano Banana” 一周吸引千万用户，图像编辑轻松搞定！玩出新花样！教你用Lovart + Nano Banana无脑批量制作知识卡片海报！ OpenAI 推出 AI 招聘平台，计划与 LinkedIn 竞争华纳兄弟探索公司起诉 Midjourney侵犯其版权角色 MIT 报告揭示 95% 企业 GenAI 项目失败，批评者称其过于简化

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 AI新词 Anthropic 英伟达论文训练代码算法 LLM Stable Diffusion 芯片腾讯蛋白质开发者 Claude 苹果 AI for Science Agent 生成式神经网络机器学习 3D 研究 xAI 生成人形机器人 AI视频计算百度 Sora 工具 GPU 华为 RAG 大语言模型 AI设计字节跳动具身智能搜索大型语言模型场景深度学习视频生成预测 AGI 视觉伟达架构 Transformer 神器推荐亚马逊特斯拉编程 Copilot DeepMind