AIGC宇宙 AIGC宇宙

文章列表

免费!人手必备的AI视频生成神器 PixVerse 有多好用?

前言 最近在深度使用 PixVerse 后,制作了 AIGC 视频《恭喜发福》,对比其他几款免费版 AI 视频工具 MoonValley、Morph Studio 来说,PixVerse 显然在 AI 视频的运动效果上表现得更自然,最重要的是 PixVerse「Upscale」功能,不用花钱就可以提高视频分辨率,确实太香了!:视频版当视频在手机上无法加载,可前往PC查看。一、初步体验 接下来让我们一起来试一试吧。 目前,PixVerse 可以在官网上或者 Discord 上使用。目前 Discord 上不能建立私人
4/1/2024 7:00:47 AM
yaoyao

谷歌:手机运行人工智能模型将占用大量内存

谷歌在 3 月初发布了一个奇怪的声明,称旗下两款新手机 Pixel 8 和 Pixel 8 Pro 中,只有 Pixel 8 Pro 能够运行其最新的人工智能模型“Google Gemini”。尽管两款手机的配置非常相似,但谷歌却以神秘的“硬件限制”为由拒绝在 Pixel 8 上运行该模型。这番言论让人费解,因为谷歌一直宣称 Pixel 8 是以人工智能为核心的手机,并且还专门针对智能手机设计了“Gemini Nano”模型,然而这两者居然无法兼容运行。几周后,谷歌似乎开始松口,宣布即将在 6 月的季度更新中为 P
3/31/2024 12:08:38 PM
远洋

15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

感谢OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespa
3/30/2024 11:50:43 AM
故渊

阿里出品!用一篇文章帮你了解AI数字人行业

人工智能(AI)技术的进步不仅改变了我们生活的方方面面,还在各行各业中展现出了巨大的潜力。AI 数字人,作为人工智能技术的一个重要分支,正在逐渐成为众多行业关注的焦点。这些虚拟的数字角色不仅具有逼真的外观和行为,还能够以超乎想象的方式与人类交互,从而提供全新的服务体验和业务机会。本文整理了 AI 数字人相关的基础概念、趋势报告、热点案例、AI 数字人平台和开源项目,以及作为设计师我们能用这些 AI 能力产出哪些有意思的工作。 :一、AI 数字人基础概念 1. 什么是 AI 数字人? "数字人"是指利用先进的计算机图
3/30/2024 8:46:09 AM
团队阿里健康设计

消息称微软携手 OpenAI 打造新 AI 超算:代号“星际之门”、投入 1000 亿美元

感谢根据国外科技媒体 The Information 报道,微软正携手 OpenAI,投入 1000 亿美元(IT之家备注:当前约 7240 亿元人民币),开发代号为“Stargate”的全新人工智能超级计算机。Stargate 也是一部 1994 年上映的电影名称,中文译名为《星际之门》。IT之家查询相关资料,米高梅和华纳兄弟公司有意重启 1994 年的经典科幻电影《星际之门》,由著名导演罗兰・艾默里奇 (Roland Emmerich) 来执导,重启之后的《星际之门》将拍摄成三部曲形式。回归到微软和 OpenA
3/30/2024 8:17:50 AM
故渊

在好莱坞发动“魅力攻势”,消息称 OpenAI 向派拉蒙、环球等影业巨头展示 Sora

感谢据英国《金融时报》报道,OpenAI 近期在好莱坞发动了一场“魅力攻势”—— 与派拉蒙、环球和华纳兄弟探索等主要电影公司举行会议,展示其视频生成技术 Sora,并缓解对人工智能模型将损害电影行业的担忧。报道援引多位知情人士消息称,OpenAI 首席执行官山姆・阿尔特曼和首席运营官布拉德・莱特凯普在近期数日间举行的会议上,向影业巨头高管们做了 Sora 的产品介绍。参与会议的人员表示,OpenAI 正在就如何推出 Sora 寻求影业高管们的意见。一些观看了演示的人说,他们可以看到 Sora 或类似的人工智能产品如
3/29/2024 5:35:09 PM
清源

客户抱怨 Copilot 不如 ChatGPT,微软回应:客户“打开方式不对”

微软的 Copilot AI 和 OpenAI 的 ChatGPT 固然一脉相承,但用户反馈来看,他们更偏向于后者,认为 ChatGPT 更好用。对此微软员工给出的回应是,这些抱怨的用户还不够了解 Copilot,无法充分使用 Copilot 的各项技能。国外媒体 Business Insider 在报道中援引一位微软客服人员的采访内容,表示经常收到用户的反馈,比较 Copilot 和 ChatGPT,然后说:“你们用的不是一样的技术吗?”该微软员工表示目前使用 Copilot 的主要是 Microsoft 365
3/29/2024 10:37:49 AM
故渊

万字干货!Stable Diffusion基础入门+案例实操+参数讲解+工具模型

相关阅读推荐:
3/29/2024 8:16:01 AM
大摸鱼家_Xr

优于人类专家,GPT-4 准确注释单细胞类型,成本低且稳健

编辑 | 萝卜皮GPT-4 是一种专为语音理解和生成而设计的大型语言模型。哥伦比亚大学梅尔曼公共卫生学院(Columbia University Mailman School of Public Health)的 Wenpin Hou 和杜克大学医学院(Duke University School of Medicine)的 Zhicheng Ji 证明,大语言模型 GPT-4 可以在单细胞 RNA 测序分析中使用标记基因信息准确注释细胞类型。「注释单个细胞的细胞类型的过程通常非常耗时,需要人类专家比较跨细胞簇的基
3/28/2024 6:44:00 PM
ScienceAI

GPTs 大翻车后,OpenAI 再宣布给开发者送钱!美国码农狂欢

【新智元导读】OpenAI 给开发者分钱了!就在刚刚,OpenAI 宣布 GPT 将「货币化」,所有美国开发者都可以得到收入分成,具体细节还在摸索。开发者欢呼:爱死 OpenAI 了!OpenAI,又要和开发者分钱了!就在刚刚,OpenAI 宣布,将要和一群美国开发者合作,测试 GPT 基于使用情况的收入。此举的目标,是创建一个充满活力的生态系统,让开发者的创造力和影响力得到回报。今年 1 月 GPT Store 正式上线的同时,OpenAI 曾在博客中表示:今年第一季度我们将推出 GPT 创建者收入计划。作为第一
3/28/2024 2:49:47 PM
清源

和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异

根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。该机构推出 Chatbot Arena,这是一个针对大型语言模型(LLM) 的基准平台,以众包方式匿名、随机对抗测评大模型产品,其评级基于国际象棋等竞技游戏中广泛使用的 Elo 评分系统。评分结果通过用户投票产生,系统每次会随机选择两个不同的大模型机器人和用户聊天
3/28/2024 1:51:54 PM
故渊

Viggle 超全使用教程!AI 终于能准确控制人物姿势了!

大家好,这里是和你们一起探索 AI 的花生~ 今天为大家推荐一款新的 AI 视频制作工具 Viggle,它可以通过文本或视频生成带有指定动作的角色,从而提升 AI 视频中人物行为的可控性,今天就为大家详细介绍一下它的特点与用法~ Viggle AI 官网: (服务托管在 Discord 中) Viggle 在上线之后很快就引起了关注,因为它解决了 AI 视频生成中一个非常重要的问题——如何准确控制角色的肢体动作。之前我们了解的一些 AI 视频工具,基本都是通过文本或者图像来生成视频,是对画面整体添加动态,很难准确
3/28/2024 8:43:23 AM
夏花生

视觉盛宴!7位顶级艺术家最新 Sora 作品震撼发布!

昨天早上 Open AI 终于放出最新的七部 Sora 视频作品,基于最近有测试名额的世界顶级艺术家创作生成。七部 AI 短片,加上配音和旁白,效果真的很惊艳!相比 2 月 Sora 发布的 48 个视频,果然艺术家创作者会让视频变成故事,更打动人。至此在 2 月 16 日 Sora 发布后,同一天 Open AI 在 Tiktok 上开了账号每天会发布内部制作的 Sora 视频。目前已经发布 65 个视频作品,吸引 270.3K 位粉丝。接下来让我们一起看看这七部作品吧。 一、shy kids – “Air He
3/28/2024 8:40:39 AM
yaoyao

号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5

初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。DBRX 采用 transformer 架构,包含 1320 亿参数,共 16 个专家网络组成,每次推理使用其中的 4 个专家网络,激活 360 亿参数。Databricks 在公司博客文章中介绍,在语言理解、编程、数学和逻辑方面,对比 Meta 公司的 Llama 2-70B、法国 Mistral AI 公司的 Mixtral 以及马斯克旗下 xA
3/28/2024 7:57:39 AM
故渊

谁将替代 Transformer?

Transformer 由于其处理局部和长程依赖关系的能力以及可并行化训练的特点,一经问世,逐步取代了过去的 RNN(循环神经网络)与 CNN(卷积神经网络),成为 NLP(自然语言处理)前沿研究的标准范式。 今天主流的 AI 模型和产品——OpenAI 的ChatGPT、谷歌的 Bard、Anthropic 的 Claude,Midjourney、Sora到国内智谱 AI 的 ChatGLM 大模型、百川智能的 Baichuan 大模型、Kimi chat 等等——都是基于Transformer 架构。 Transformer 已然代表了当今人工智能技术无可争议的黄金标准,其主导地位至今无人能撼动。
3/27/2024 7:06:00 PM
张进

手机大模型崛起:荣米 OV 的战场厮杀

作者丨郭思编辑丨陈彩娴数据显示,2023年全球智能手机出货量同比下滑3.2%,总数仅为11.7亿部。 手机市场的饱和,早已是行业共识。 尽管如此,智能手机作为主流的通讯和娱乐工具,业界人士表示,其地位在未来五年内不太可能被迅速替代。
3/27/2024 2:05:00 PM
郭思

实名羡慕!这些人已经用上了Sora

Sora 第三方口碑出炉,或许带给艺术家们最大的好处是:让他们的想象力、创造力更少地受到技术层面的限制。自 OpenAI 推出 Sora 以来,一直是该团队的成员放出演示视频,何时向公众开放测试我们不得而知。Sora 的初体验到底如何?或许艺术家、创意家、导演等公众人物的试用点评值得大家参考。今早,OpenAI 首次展示了一些 Sora 生成的作品,这些作品是获得 Sora 访问权限的电影制作人、艺术家、广告公司和音乐家制作完成的。以下是艺术家作品的一些示例,以及他们对 Sora 如何融入其工作流程和业务的早期想法
3/27/2024 10:59:00 AM
机器之心

再谈复现 Sora:被仰望与被遗忘的

2月16日,OpenAI 发布了视频生成领域的重磅模型 —— Sora。Sora 对 Scaling Law 的信仰及其突破性的技术创新,使它持续保持领先地位。同时,也再次证明了“大力出奇迹”依然适用于文生视频领域。Sora 披露的技术细节,远远不足以窥其全貌。同时 Sora 目前也未正式对外开放。源于此,针对 Sora 的思考和讨论从未停止过。                              OpenAI 发布的技术报告Sora 给整个 AI 领域带来的最大冲击,莫过于如何优化和校正现有的视频生成思路和
3/27/2024 10:51:00 AM
机器之心