AIGC宇宙 AIGC宇宙

文章列表

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

都来玩这套。继 OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0 和 blueberry_1 力压 Flux.1、Ideogram v2、Midjourney v6.1 等知名模型,成为最新榜一榜二大哥。一些生成效果 be like,确实不错。不过这一次,未必是 OpenAI 跨界来搞事,背后公司更可能是打造了 Flux 的黑森林实验室。为啥?来看这组 PK。blueberry_0 生成的大胡子男人,和 Flux Pro 的几乎一模一样。有人
9/30/2024 9:57:17 AM
汪淼

2024 九月工具合集!6 款不容错过的免费 AI 神器

大家好我是花生~ 今天我们继续 AI 效率神器的第 11 期,一起来看看吧~ 上期回顾:一、抠图神器 Object Cutter 网站直达: Object Cutter 是一款在线免费的抠图工具,它的特点是可以通过文本以及选框指定需要抠取的内容。这样的好处是即使图像中有多个对象,也可以轻松指定到我们想要的那一个,免去了手动选取的麻烦,非常方便。而且抠图的效果也很精细,很小的缝隙也能处理。 使用时在原图顶部的「By prompt」和「By bounding box」中切换不同模式,然后在文本框内填写需要抠取的内容,
9/30/2024 7:58:48 AM
夏花生

一键出爆款!如何用 Coze 搭建图文生成+排版一体化工作流?

一、完整工作流拆解,一张图看懂 最终会生成的内容:4 张图片(1 张封面页,3 张内容页),如下图:我们要实现上图工作流,需要先搭建「2 个图像流,1 个工作流,1 个卡片,1 个 Bot」,如下所示:二、图像流创建:封面页 通过搭建「图像流」来生成下图这张封面:图像流拆解:1. 图像流:创建输入「名称、描述」,点击「确认」,名称可命名为「xhs_cover_page」,如下图:点击「确认」后,进入图像流编辑页面,默认有 2 个节点:「开始、结束」,如下图:2. 封面页元素拆解配置 「封面页」元素拆解, 共 8 个
9/30/2024 7:48:13 AM
省略号

AMD 推出自家首款小语言 AI 模型“Llama-135m ”,主打“推测解码”能力可减少 RAM 占用

AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,AI在线附模型地址如下(点此访问)。据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。AMD 表示,这款模型在四个 AMD Instinct MI25
9/29/2024 5:08:32 PM
漾仔

重磅!TeleAI 完成首个全国产化万卡万参大模型训练

近日,中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤
9/29/2024 4:42:00 PM
机器之心

最新测评!美图大模型提前揭秘,这波风格化美到窒息

AI好好用报道编辑:杨文支持1分钟、1080P分辨率的超长视频生成。国产视频大模型再次卷出「新高度」。 前脚快手可灵升级完 1.5 模型,后脚字节就正式进军视频生成。 几乎同一时间,美图公司也突然宣布,自家的奇想大模型(MiracleVision)视频生成能力已完成全面升级。具体而言,它不仅单次文生视频时长、单次图生视频时长均达 5 秒,还支持 1 分钟、帧率 24FPS、分辨率 1080P 的超长视频生成。 而更让人惊喜的,则是它超强的风格化。 比如,写实风格的熊猫,坐在墙根上弹着吉他:视频链接:,戴着墨镜,边走
9/29/2024 3:32:00 PM
AI好好用

研究发现:AI 越聪明就越有可能“胡编乱造”

一项新研究发现,随着大型语言模型(LLM)变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 PexelsAI在线注意到,该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现,虽然这些 LLM 的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更
9/29/2024 1:20:36 PM
远洋

最受欢迎开源大模型,为什么是通义?

开源与闭源之争早已非新奇的话题,但毋庸置疑的是,开源极大地促进了大模型技术发展和生态繁荣。 大模型被认为是最烧钱的技术,训练一个大模型往往需要大量的数据、计算资源,导致训练成本巨大,众所周知GPT-3的训练费用据说超过 4600万美元,在大模型开源之前,大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。 随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮,那些没有AI积累的企业、大量中小公司团队,今天个人开发者,都能基于开源底座模型,用很低的成本训练、部署自己的专属模型,llama 这样的开源先锋也因此拥有一众拥趸。
9/29/2024 11:15:00 AM
张进

用一篇文章,帮你掌握 Midjourney 的人物风格迁移功能!

大家好,这里是 BananaStudio,上一篇介绍了如何用提示词描述画面中的多个人物,其中提到了 cref,今天详细带大家搞清楚 MJ 人物风格化迁移功能 Character Reference,也就是—cref 命令。如何仿照目标图来生成一样的图? 现在 MJ 中有三种方式可以达成: ① 垫图(最常用的手法)将构图、主题和一些风格大致应用到你生图中。操作说明:参考图片需要上传到 Discord,复制图片的 URL 添加到提示词中。在随后的生图中将会参照你写的提示词和参考垫图中的信息,通过添加“--iw”(图片权
9/29/2024 8:24:22 AM
BananaStudio

中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源

“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(AI在线注:下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成
9/28/2024 6:38:22 PM
清源

OpenAI:计划五年内将 ChatGPT 每月订阅费用提高到最高 44 美元

感谢据 Engadget 当地时间 27 日报道,OpenAI 告诉投资者,该公司计划在今年年底前收取 ChatGPT 每月 22 美元(IT 之家备注:当前约 154 元人民币)的费用,并计划在未来五年内积极提高月费,最高将提升至 44 美元(当前约 308 元人民币)。图源 Pexels报道提到,OpenAI 正在从非营利公司向盈利公司的转变迈步,这种商业模式可取消对投资者汇报的任何上限,因此公司将有更大的空间以潜在的更高价格与新投资者谈判。文件显示,OpenAI 今年 8 月的营收为 3 亿美元(当前约 21
9/28/2024 4:18:47 PM
清源

苹果反水:OpenAI的1500亿「史上最大」融资轮,难了

有金主已经决定收手。在 OpenAI,高层变动正在成为一种传统。在不到两年的时间里,OpenAI 从一个 AI 圈内领先的实验室,发展成为一家全球知名的企业。在首席执行官山姆・奥特曼(Sam Altman)被罢免并迅速复职不到一年后,今年 9 月,三位高层领导突然宣布辞职。一个摆在台面上的问题是:这次宫斗的时间点,就在 OpenAI 即将完成可能是硅谷史上最大一轮融资的同一周。本周,OpenAI 首席技术官 Mira Murati、首席研究官 Bob McGrew 和 Post Training 研究副总裁 Bar
9/28/2024 2:26:00 PM
机器之心

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

学起来吧!近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。文章展示了如何将预训练的大型语言模型(LLM)转化为强大的文本分类器。AI在线对文章内容进行了不改变原意的编译、整理:为什么要关注分类呢?首先,针对分类任务,对预训练模型进行微调是一个简单有效的 LLM 知识入门方式。其次,文本分类有许多商业应用场景,比如:垃圾邮件检测、情感分析、客户反馈分类、主题分类等等。阅读完本文,你将找到以下
9/28/2024 2:24:00 PM
机器之心

Voyage-3 系列嵌入式 AI 模型登场:1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%

科技媒体 marktechpost 昨日(9 月 27 日)发布博文,报道称 Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式(Embedding)模型。这两个模型在技术、法律、金融、多语言应用和长文本理解等方面,均表现出超出同类模型的优势,在保持较小模型规模和较低的资源消耗情况下,为开发者提供更高效、更易于集成的解决方案。AI在线援引 Voyage AI 官方数据,在技术文档、代码、法律、金融、网页内容、多语言数据集、长文档和对话数据等方面,Voyage-3 以 1/2
9/28/2024 1:55:54 PM
故渊

实测字节豆包·视频生成模型:Sora画的饼被实现了......

但更多的网友则是期待字节的视频生成模型,因为早在去年11月,字节的项目Make Pixels Dance就展示字节具备了解决长AI视频中角色一致性难以保持的问题。 所以我也看到很多外网网友的另一个问题“Where is ByteDacne?”。 而就在9.24火山引擎AI创新巡展深圳站上,火山引擎一口气发布了个视频生成模型PixelDance和Seaweed模型。
9/27/2024 5:55:00 PM
林杰鑫

新「AI科学家」?MIT整合多智能体,实现材料科学研究自动化

编辑 | 萝卜皮人工智能(AI)的一个关键挑战是:如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中,麻省理工学院(Massachusetts Institute of Technology)原子与分子力学实验室(LAMM)的研究人员提出了 SciAgents,一种可以整合利用三个核心概念的方法:(1)使用大规模本体知识图谱来组织和互连不同的科学概念;(2)一套大型语言模型(LLM)和数据检索工具;(3)具有现场学习能力的多智能体(agent)
9/27/2024 5:41:00 PM
ScienceAI

OpenAI o1 在医学领域的初步研究,我们离 AI 医生更近了吗?

编辑 | 紫罗大语言模型 (LLM) 在各个领域和任务中都表现出了卓越的能力,突破了我们在学习和认知方面的知识界限。最新模型 OpenAI 的 o1 脱颖而出,成为第一个使用思维链 (CoT) 技术和强化学习的 LLM。虽然 o1 在一般任务中表现良好,但它在医学等专业领域的表现仍然未知。目前医学 LLM 的基准通常集中在一定范围内,例如知识、推理或安全,这使得在复杂的医学任务中对这些模型进行全面评估变得复杂。来自加州大学圣克鲁斯分校、爱丁堡大学和美国国立卫生研究院的研究人员评估了 OpenAI 的 o1 模型在医
9/27/2024 5:36:00 PM
ScienceAI

OpenAI人事地震24小时,奥特曼盟友Greg休假中发声,网友:你留下吗?

还记得休假到 2024 年底的 OpenAI 总裁 Greg Brockman 吗?在 OpenAI 的又一次人事巨震后,经过一天的沉默,Greg 终于发声了,小作文相比山姆・奥特曼的篇幅长了不少。我对 Barret、Bob 和 Mira 为 OpenAI 所做的贡献深表感激。我们合作多年,我们都是帮助 OpenAI 走到今天的团队成员。他们每个人都为团队做出了贡献。关于他们每个人,我都有一段小故事:Mira 和我最初是在 GPT-3 API 项目上密切合作,这是 OpenAI 创建的第一个产品,也可能是我做过的最
9/27/2024 2:13:00 PM
机器之心