AIGC宇宙 AIGC宇宙

文章列表

仅用一张正面图,如何用AI做出8个视角图?

不会用3D类软件的同学,怎么做出3D立体8视图? 看完这篇教程你就能举一反三了! 大厂实战案例!
8/16/2024 12:14:48 AM
sea

Llama 8B 搜索 100 次超越 GPT-4o,推理 + 搜索即可提升性能

最新论文表明,LLM 等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅 8B 的 Llama 3.1 模型搜索 100 次,即可在 Python 代码生成任务上达到 GPT-4o 同等水平。强化学习先驱、加拿大阿尔伯塔大学 CS 系教授 Rich Sutton 曾在 2019 年写下一篇名为《The Bitter Lesson》的博文,成为 AI 领域的经典论述之一。甚至,Rich Sutton 在字里行间体现出的直觉已经颇有 Scaling Law 的意味。原文地址: /
8/15/2024 11:52:28 PM
问舟

OpenAI 投的代码工具 Cursor“叛变”了:默认使用 Claude,程序员叫好

我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是 Claude-3.5-Sonnet 来接待。
8/15/2024 3:09:43 PM
汪淼

Nature 曝惊人内幕:论文被天价卖出喂 AI,作者 0 收入

Nature 的一篇文章透露:你发过的 paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?全球数据告急,怎么办?论文来凑!最近,Nature 的一篇文章向我们揭露了这样一个事实:连科研论文,都被薅去训 AI 了……据悉,很多学术出版商,已经向科技公司授权访问自家的论文,用来训练 AI 模型。一篇论文从酝酿 idea 到成稿,包含了多少作者日日夜夜的心血,如今很可能在不知情的情况下,就成为训 AI 的数据。这合理吗?更可气的是
8/15/2024 12:53:16 PM
汪淼

古尔曼:苹果在 AI 领域至少落后谷歌两到三年

昨天谷歌提前召开新品发布会,抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能,引发业内广泛关注。彭博社记者马克・古尔曼称,苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能,将其深度整合到了 Android 和 Pixel 手机中。相比之下,苹果虽然在 WWDC 上公布了 Apple Intelligence,但实际应用尚不成熟,消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外,谷歌还强调 Gemini
8/15/2024 11:05:38 AM
远洋

OpenAI 首席战略官 Jason Kwon:不会一夜之间突然发布一个“包罗万象”的 AI

韩媒“Chosun Ilbo”当地时间周二公布了 8 月 7 日对 OpenAI 首席战略官 Jason Kwon 的采访内容。Jason Kwon 负责监督 OpenAI 未来的战略制定,处理围绕 AI 的伦理和法律问题,同时也参与技术开发。图源 PexelsAI在线汇总对话主要内容如下:Jason Kwon 认为,关键技术发展到通用人工智能(AGI)可能还需几年时间。“我们内部假设这可能比预期更快到来,因此正在相应地准备安全措施。”尽管业界认为 AGI 可能在三到五年之间出现,但 Jason Kwon 认为这一
8/15/2024 8:51:54 AM
清源

第二波!2024年8月精选实用设计工具合集

大家好,这是 2024 年 8 月的第 2 波干货合集! 在搜集整理 3D 工具的时候,我注意到 2 个对于设计师非常友好的 3D 工具,其中一个是更加适宜新手入坑 3D 的建模平台 Womp3D,以及可以帮助前端快速将 3D 资源插入到网页中的代码工具,这俩在网页前端设计落地的过程中,甚至可以直接联动起来。 而 AI 工具这边,这期搜集到了 3 个非常值得关注的好东西,一个是阿里出品的开源的 AI 自动剪辑工具,对于做影视的小伙伴会非常友好,另外 2 个则和 UI 设计落地有关的 AI 平台,它们甚至隐约呈现出了
8/15/2024 7:19:49 AM
陈子木

集成 Photoshop 功能的强大节点!ComfyUI layer style节点保姆级教程(一)

前言: 学习 ComfyUI 是一场持久战,而 ComfyUI layer style 是一组专为图片设计制作且集成了 Photoshop 功能的强大节点。该节点几乎将 PhotoShop 的全部功能迁移到 ComfyUI,诸如提供仿照 Adobe Photoshop 的图层样式、提供调整颜色功能(亮度、饱和度、对比度等)、提供 Mask 辅助工具、提供图层合成工具和工作流相关的辅助节点、提供图像效果滤镜等。旨在集中工作平台,使我们可以在 ComfyUI 中实现 PhotoShop 的一些基础功能。一、安装方式 方
8/15/2024 12:01:13 AM
AI实战

AI在用 | 穿越了!3款AI工具让梵高、莫扎特们「活」在当下

机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。最近,有博主将一堆世界名人的自画像制成了动画,吸引了不少网友围观。例如,文森特・梵高略带忧郁地抚摸着红色的络腮胡子:一副贵族气质的莫扎特摆弄起礼服:写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑:贝多芬忘我地拉着小提琴:还有达芬
8/14/2024 5:04:00 PM
机器之能

OpenAI 找回场子:chatgpt-4o-latest AI 模型力压谷歌 Gemini 1.5 Pro,多项跑分重夺第一

谷歌上周发布最强 Gemini 1.5 Pro 模型,在 LMSYS 的聊天机器人竞技场(Chatbot Arena)比赛中取得第一名,而 OpenAI 迅速“找回场子”,最新 chatgpt-4o-latest 模型重夺第一。chatgpt-4o-latest 简介OpenAI 公司上周发布了 gpt-4o-2024-08-06,其 API 支持结构化输出;昨日再次发布了名为 chatgpt-4o-latest 的全新前沿模型,是 GPT-4o 的最新版本,上下文窗口输入最高 128000 个词元(tokens)
8/14/2024 12:33:56 PM
故渊

谷歌版 Her 大翻车:试了 3 次且换手机才成功… 网友:我手动只需 10 秒

翻车,大翻车。就在今天凌晨,谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的 demo 中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让 Gemini 查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候,画风却 180° 大变样。请看 VCR: 第一次:失败了。第二次:失败了。第三次:换手机,成功了。嗯…
8/14/2024 12:26:03 PM
清源

集体诉讼已受理:艺术家指控 Stability AI、Midjourney 等公司非法利用其版权内容训练 AI

美国当地法院主审法官昨日(8 月 13 日)裁定,可以继续推进 AI 图片训练集体诉讼案件,不过驳回了部分诉求。AI在线从报道中获悉,原告由多名艺术家组成,被告为 Stability AI、Midjourney 和其它 AI 相关公司,原告指控其非法使用版权作品用于训练 AI。该集体诉讼原告表示,目前诸多主流 AI 文生图服务所使用的数据集中,包含了他们创造的版权作品。法官威廉・奥里克(William Orrick)批准了针对 Stability 公司的额外诱导性版权侵权索赔,并受理原告对 DeviantArt(该
8/14/2024 9:58:37 AM
故渊

谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用
8/14/2024 3:02:04 AM
故渊

神器大盘点!B站700万人气的AI整活视频都是如何完成的?

大家好,这里是和你们一起探索 AI 的花生~ 巴黎奥运会已经结束了,这段时间除了观看激动人心的竞赛,我的另一大乐趣就是在 B 站看各种奥运会的吐槽/整活视频。而在这个过程中,我也发现不少视频都用上了 AI 技术,给人带来了新的观看体验。那么今天就和大家聊聊其中比较新奇有趣的效果以及相关实现方法,说不定哪天你也用得上~ 相关推荐:一、视频角色替换 首先是一个调侃在奥运 会开幕式上出场的 “蓝精灵” 的视频。由于 “蓝精灵” 的装扮造型和 86 版《西游记》里的青狮怪非常相似,于是一个 B 站 up 主借用了电影《美人
8/14/2024 12:59:32 AM
夏花生

最强 AI 程序员 Genie 砸饭碗:84 秒跑通代码,像人一样思考,团队仅 5 人

继 Devin 之后,又一个 AI 软件工程师被刷屏了 —— 它叫 Genie,号称目前地表最强,已经可以像人一样思考和行动了!那么这个“地表最强”,到底强到什么程度?先来看下评测分数。在权威榜单 SWE-Bench 中,Genie 以解决了 30.07% 问题的成绩夺得榜首。(SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。)而这个成绩可谓是遥遥领先第二名 19.27%,解锁了提升 SOTA 的最大增幅 —— 57%!至于 Genie 的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解
8/13/2024 2:00:40 PM
汪淼

AI出图更快、更美、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?

随着大模型的落地按下加速键,文生图无疑是最火热的应用方向之一。自从 Stable Diffusion 诞生以来,海内外的文生图大模型层出不穷,一时有「神仙打架」之感。短短几个月,「最强 AI 画师」的称号几次易主。每一次技术迭代,都不断刷新着AI图像生成质量和速度的上限。于是现在,我们输入几个文字就能得到任何想要的画面。无论是专业级别的商业海报,还是超写实画风的写真照片,AI 制图的逼真程度已经让我们叹为观止。甚至 AI 赢下了 2023 年度的索尼世界摄影奖。在大奖公布之前,这幅「照片」已经在伦敦萨默赛特宫进行展
8/12/2024 2:40:00 PM
机器之心

2024AGI商业趋势大会最新嘉宾议程公布,相约深圳见证AI闪光时刻

2024年,AI的身影已经无处不在。在巨头的大模型竞技场之外,更广泛的创业者、开发者和个人玩家越来越关注用AI来解决具体的商业诉求,改善自己的工作流。作为业界期待的“下一个互联网”,乃至“超越移动互联网的平台式机会”,创业者们正在积极探索智能与营销、设计、硬件、金融、教育、医疗等具体行业和精准场景的结合。从文本到图像、音乐和视频;由知识问答到导购客服、代码辅助、情感陪伴,乃至导诊分诊、法律咨询、科研开发,用AI “重做一遍应用”的预言似乎正在变成现实。超级应用会在何处诞生?大模型凶猛,小而美的产品会有机会吗?那些完
8/12/2024 10:48:00 AM
新闻助手

如何设计能让用户自发传播的 AI 应用?完整流程来了!

一、市场的现状与尝试 1. 当前现状 目前在各领域中的人工智能(AI)现状,由于企业级(B 端)和消费者级(C 端)AI 应用在功能和目标用户群体方面存在显著差异,导致其工具属性显得尤为突出。无论在何种场景下,用户在使用 AI 技术时,主要目的是提高效率或解决特定问题。 然而,大多数普通用户难以直接接触到 AI 技术,在使用过程中仍面临一定的门槛。而这些普通用户通常是通过其他应用程序间接地接触到 AI 技术。在面对市场上众多 AI 工具的情况下,我们需要结合自身业务的特性和当前状况,思考如何使钉钉上的更多非专业的普
8/12/2024 1:21:44 AM
团队钉钉设计