AIGC宇宙 AIGC宇宙

文章列表

开源端到端语音大模型Step-Audio-AQAA:听懂音频直接生成自然语音

在人工智能领域,尤其是生成式对抗网络(AIGC)方面的不断进展,语音交互已成为一个重要的研究方向。 传统的大语言模型(LLM)主要专注于文本处理,无法直接生成自然语音,这在一定程度上影响了人机音频交互的流畅性。 为了突破这一局限,Step-Audio 团队开源了一款全新的端到端语音大模型 ——Step-Audio-AQAA。
7/2/2025 5:00:55 PM
AI在线

硅谷 AI 人才争夺战愈发激烈:年薪千万美元抢夺顶尖科学家

硅谷AI人才争夺战白热化!Meta、OpenAI等科技巨头为顶尖AI科学家开出千万年薪,薪酬较2022年暴涨50%。#AI人才争夺战# #硅谷高薪# 报告显示,AI科学家更看重研究自由与使命,小型公司面临巨大招聘压力。
7/2/2025 4:08:18 PM
远洋

百度发布自研视频生成模型MuseSteamer及视频产品平台“绘想”

在近期的百度AIDAY科技开放日活动上,百度商业研发团队正式宣布推出两项重磅创新成果:自研视频生成模型MuseSteamer和全新的视频产品平台**“绘想”**。 MuseSteamer作为百度自主研发的视频生成模型,标志着百度在人工智能生成内容(AIGC)领域,特别是在视频创作方面取得了重要进展。 而同步发布的视频产品平台“绘想”,则将为用户提供一个集成化的工具,有望降低视频创作门槛,提升内容生产效率。
7/2/2025 3:00:55 PM
AI在线

AI 冲击就业:报告称 2025 英国初级职位招聘数较 2022 年降低 32%

据Adzuna的数据显示,自2022年ChatGPT发布以来,英国初级职位的数量下降了三分之一。非技术或专业化程度较低的工作,如客户服务,面临被AI替代的最大风险。
7/2/2025 11:52:27 AM
故渊

​OpenAI 启动高端企业 AI 咨询服务 客户收费至少 1000 万美元

据 The Information 报道,OpenAI 正在加大其企业 AI 咨询业务的力度,收费标准至少为每位客户1000万美元。 公司工程师直接与各组织合作,调整如 GPT-4o 等模型以适应其特定数据,并构建定制应用程序,包括聊天机器人等。 这一举措使 OpenAI 与诸如 Palantir 和 Accenture 等知名企业展开直接竞争。
7/2/2025 11:00:54 AM
AI在线

Capital One 借助 AI 技术革新汽车销售模式

在近期的 VB Transform 大会上,Capital One 的 AI 基础技术负责人 Milind Naphade 分享了他们如何通过构建智能代理平台来推动汽车业务的发展。 Naphade 指出,该公司在15个月前开始设计这些智能代理,目标是使其具有人类代理的特点,能够与客户进行有效的沟通与问题解决。 图源备注:图片由AI生成,图片授权服务商Midjourney为了实现这一目标,Capital One 在设计其智能代理时借鉴了自身的运营模式。
7/2/2025 10:00:54 AM
AI在线

震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了

Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水

大模型时代,通用视觉模型将何去何从?

过去几年,通用视觉模型(Vision Generalist Model,简称 VGM)曾是计算机视觉领域的研究热点。 它们试图构建统一的架构,能够处理图像、点云、视频等多种视觉模态输入,以及分类、检测、分割等多样的下游任务,向着「视觉模型大一统」的目标迈进。 然而,随着大语言模型 LLM 的迅猛发展,研究热点已经悄然发生转移。
7/2/2025 9:17:13 AM

OpenAI CEO 奥特曼发声:Meta 挖角无损核心团队,承诺薪酬调整

近日,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)对 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)在人工智能领域的挖角行为进行了公开回应。 奥特曼表示,尽管 Meta 招募了一些优秀人才,但 OpenAI 仍然拥有其核心的顶尖团队,未受到实质性影响。 在周一的一份内部声明中,奥特曼明确表示,选择留在 OpenAI 对那些志在打造通用人工智能(AGI)的人来说是最明智的决定。
7/2/2025 9:00:44 AM
AI在线

Meta抄袭DeepSeek大翻车?硅谷大佬爆料亮点满满,AI军备烧钱真相震碎硅谷

谁会首先到达ASI(超级智能)? 大佬斩钉截铁的回答,让主持人惊呆了几秒。 GPT-4.5到底哪里出了问题?
7/2/2025 8:47:00 AM

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

谁能想到,作为童年回忆的宝可梦,现在竟摇身一变,成了大模型的试金石! 在无数人的童年记忆中,《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。 然而,要真正通关这款游戏,仍然需要缜密的规划和大量的时间投入。
7/2/2025 2:45:00 AM
新智元

小扎官宣Meta超级智能实验室,11 位 OpenAI / Anthropic 大牛火线加盟(七位华人)

据彭博社报道,Meta CEO扎克伯格宣布,对公司人工智能部门进行全面重组,成立“Meta超级智能实验室”(Meta Superintelligence Labs,简称MSL),目标是研发能够匹敌甚至超越人类的AI系统。 他在内部备忘录中表示:“超级智能的实现已经开始进入视野。 我相信这将是人类新纪元的开始。
7/2/2025 1:40:00 AM

人人都能轻松建模!4款大厂出品的AI建模工具深度测评

随着生成式 AI 技术的飞速发展,3D 内容创作正迎来前所未有的变革。 无论是游戏开发、影视动画、AR/VR、还是产品设计,3D 建模的时间和技术门槛一直是设计流程中的痛点。 而现在,基于 AI 驱动的 3D 生成工具,正成为越来越多设计师和开发者的新利器。
7/2/2025 12:14:57 AM
58UXD 团队

保姆级教程!超详细的AI做图全流程案例演示

今天给大家带来一个 APP 风格相机元素的设计,先来看图效果:效果很不错吧? 马上给大家拆解制作步骤! 往期教程:.
7/2/2025 12:06:02 AM
菜心¹

AI实战案例:快速实现快递查询助手!

昨晚直播,咱们用 RAG(Retrieval-Augmented Generation,检索增强生成)实现了数据库 AI 助手,今天我们准备换一个技术使用 function call 来实现快递 AI 助手。 执行效果快递 AI 助手的业务逻辑很清晰,就是我通过 LLM 大语言模型的对话来查询我的快递详情,例如,我问 AI 我有几个“运送中”的快递,他把这些快递查询并展示出来,效果如下图所示:什么是 function call? 定义: Function Call(也称为 Tool Call)它允许大模型与一组 API 或工具进行交互,从而增强其功能。
7/2/2025 12:00:00 AM

苹果自研AI被爆失败!Siri拟换脑:GPT与Claude决胜负!后者开出天价:年费数十亿才给用,年年涨价!网友:这下苹果尴尬了

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI和Claude的新一轮战争打响了! 这一次是争夺苹果Siri! 苹果终于放弃了幻想,已正式启动外部模型招标,为 Siri 提供 AI 支持。
7/1/2025 6:04:22 PM
伊风

OpenAI要抛弃英伟达?紧急辟谣:转向谷歌TPU是乌龙,根本无部署计划!满血版芯片谷歌自留,OpenAI被迫搞自研今年就流片!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“OpenAI转向谷歌芯片”? 这事恐怕真被大家误会了。 几天前,路透社爆出猛料——知情人士称,OpenAI 已经开始租用谷歌的 AI 芯片 TPU,用来支撑 ChatGPT 和其他产品的运行。
7/1/2025 12:22:17 PM
伊风

OpenAI:正对谷歌 TPU 进行早期测试,暂无大规模部署计划

AI 硬件从实验室测试到大规模商用部署间仍有一段路要走。OpenAI 也在开发自研 AI ASIC。
7/1/2025 10:27:05 AM
溯波(实习)