AIGC宇宙 AIGC宇宙

文章列表

举报人「自杀」,OpenAI表示震惊!NYU教授发长文悼念:警钟仍在回响

几天前,消息曝出,曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。 Suchir Balaji曾参与了ChatGPT后训练、GPT-4预训练,以及o1推理的研发工作。 今年10月,他在自己的一篇博文和「纽约时报」的专访中指出,OpenAI在使用新闻和其他网站的信息训练其AI模型时,违反了「合理使用」原则。
12/17/2024 4:51:45 PM
新智元

宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学

9.9万元起,还能够大规模量产的国产人形机器人,表现得实在是太6了:而且还走上了开源路线,就在刚刚,宇树机器人开源的强化学习代码又更新了! 更新之后不再是只能训练——不仅能够仿真运行,还能部署到实体机器,整个过程所有代码全部开放。 一开始,宇树开源的是英伟达Issac Gym平台上的训练代码,这次新增了对MuJoCo模拟仿真的支持。
12/17/2024 1:00:00 PM
量子位

ChatGPT地位不保?科技爱好者更喜欢拥有“情绪智力”的Claude

Claude是AI企业Anthropic开发的聊天机器人,它的名气远不如ChatGPT,目标也不是让用户与逼真的AI伙伴建立关系,但它仍然给OpenAI带来一些威胁。 由于Claude很机智,很敏感,科技爱好者渐渐喜欢上Claude。 一些爱好者甚至每天要与Claude对话十几次,向它询问工作建议、健康问题、人际关系问题。
12/17/2024 12:28:06 PM
极客AI

为多模态LLM引入ControlNet理念,开源插件解决灾难性遗忘

多模态大模型内嵌语言模型总是出现灾难性遗忘怎么办? 像文生图那样有ControlNet即可解决。 这就是由360人工智能研究院提出的IAA的核心思路。
12/17/2024 12:08:21 PM

ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT今天带来的是搜索功能方面的一些迭代升级(更像谷歌了)。 主要有三点,私以为最大亮点是第二:根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;免费,接下来逐步向所有ChatGPT用户开放。 官方信息显示,ChatGPT Search背后是微调后的GPT-4o模型,使用新颖的合成数据生成技术进行post-trained(包括从OpenAI o1-preview中提炼输出合成数据)。
12/17/2024 8:25:00 AM
量子位

华为诺亚解析:推荐系统的技术演进及大模型应用实践

一、推荐系统问题和背景首先来简要介绍一下个性化推荐系统。 实际上,我们每个人每天都在与众多推荐系统进行交互。 例如,购买衣物、阅读新闻或聆听音乐时,我们打开的每一个应用程序或网页,其展示的内容即为推荐系统所呈现。
12/17/2024 8:11:27 AM
刘卫文

本地构建Llama 3.2-Vision多模态LLM聊天应用实战

译者 | 朱先忠审校 | 重楼本文将以实战案例探讨如何在类似聊天的模式下从本地构建Llama3.2-Vision模型,并在Colab笔记本上探索其多模态技能。 简介视觉功能与大型语言模型(LLM)的集成正在通过多模态LLM(MLLM)彻底改变计算机视觉领域。 这些模型结合了文本和视觉输入,在图像理解和推理方面表现出令人印象深刻的能力。
12/17/2024 8:05:34 AM
朱先忠

OpenAI 为 ChatGPT 增加实时搜索功能,逐步向所有用户免费开放

用户可以获得快速、及时的答案,并附有相关网络来源的链接。ChatGPT 会根据用户的要求进行搜索,或通过点击网络搜索图标手动进行搜索。
12/17/2024 7:39:02 AM
沛霖(实习)

亿级项目视觉设计也用AI?落地真实案例大揭秘!

更多58设计案例;. 如何打造成功的户外品牌广告? 58高手总结了6个步骤!
12/17/2024 12:10:48 AM
58UXD 团队

Midjourney 重磅更新!多人世界构建工具 Patchwork(附基础操作)

更多MJ教程:. 秒变Midjourney高手! 精选 68 条高级感的 sref 风格代码我整理了最近觉得有意思且有趣的风格代码分享给大家,依旧是 X 特上活跃的两位大佬,@Erik_Knobl 和 @Drew Brucker。
12/17/2024 12:01:27 AM
RaDesign

谷歌 Gemini 2.0 成“P 图神器”,各种 P 图只需一句话

输入指令“把这辆车改装成敞篷车”,它就能立马将文字指令和图片结合起来,完成一键 P 图。
12/16/2024 10:49:09 PM
汪淼

微软 CEO 纳德拉力挺 OpenAI:在人工智能竞赛中领先两年,几乎“没有竞争对手”

据《商业内幕(Business Insider)》报道,微软首席执行官萨提亚·纳德拉最近表示,OpenAI在人工智能领域拥有两年的领先优势,使其几乎“没有竞争对手”(pretty much uncontested)。
12/16/2024 7:25:33 PM
清源

Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真

最近,Ilya在NeurIPS 2024中宣布:预训练结束了! 在他看来,数据如同化石燃料般难以再生,因此训练模型需要的海量数据即将枯竭。 作为前OpenAI首席科学家,Ilya的这番话,有可能影响之后数十年的AI发展方向。
12/16/2024 6:20:32 PM
新智元

图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

OpenAI最近推出了在大语言模型LLM上的强化微调(Reinforcement Finetuning,ReFT),能够让模型利用CoT进行多步推理之后,通过强化学习让最终输出符合人类偏好。 无独有偶,齐国君教授领导的MAPLE实验室在OpenAI发布会一周前公布的工作中也发现了图像生成领域的主打方法扩散模型和流模型中也存在类似的过程:模型从高斯噪声开始的多步去噪过程也类似一个思维链,逐步「思考」怎样生成一张高质量图像,是一种图像生成领域的「图像链CoT」。 与OpenAI不谋而和的是,机器学习与感知(MAPLE)实验室认为强化学习微调方法同样可以用于优化多步去噪的图像生成过程,论文指出利用与人类奖励对齐的强化学习监督训练,能够让扩散模型和流匹配模型自适应地调整推理过程中噪声强度,用更少的步数生成高质量图像内容。
12/16/2024 5:44:18 PM
新智元

全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹

全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。
12/16/2024 4:10:15 PM

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。 近期,李飞飞教授团队通过单张图片生成三维物理世界的研究,再次向世界展示了空间智能技术的巨大潜力。 单图生成三维世界,不仅让人们能以交互方式探索静态图像,更标志着 AI 在重建与理解物理场景方面迈入全新阶段。
12/16/2024 2:40:00 PM
机器之心

OpenAI启动ChatGPT Projects,让你可以组织文件、分组聊天

OpenAI最新发布的ChatGPT . Projects,解决了在ChatGPT上整理文件和对话的需求,该功能与谷歌广受欢迎的NotebookLM应用类似。 在“OpenAI 12日”直播活动的第六天,该公司推出了ChatGPT .
12/16/2024 2:20:55 PM
Emilia David

Bengio参与的首个《AI安全指数报告》出炉,最高分仅C、国内一家公司上榜

图片安全话题,在人工智能(AI)行业一向备受关注。 尤其是诸如 GPT-4 这样的大语言模型(LLM)出现后,有不少业内专家呼吁「立即暂停训练比 GPT-4 更强大的人工智能模型」,包括马斯克在内的数千人纷纷起身支持,联名签署了一封公开信。 这封公开信便来自生命未来研究所(Future of Life Institute),该机构由麻省理工学院教授、物理学家、人工智能科学家、《生命 3.0》作者 Max Tegmark 等人联合创立,是最早关注人工智能安全问题的机构之一,其使命为 “引导变革性技术造福生活,避免极端的大规模风险”。
12/16/2024 2:20:00 PM
机器之心