文章列表

分类

标签

开源端到端语音大模型Step-Audio-AQAA：听懂音频直接生成自然语音

在人工智能领域，尤其是生成式对抗网络（AIGC）方面的不断进展，语音交互已成为一个重要的研究方向。传统的大语言模型(LLM)主要专注于文本处理，无法直接生成自然语音，这在一定程度上影响了人机音频交互的流畅性。为了突破这一局限，Step-Audio 团队开源了一款全新的端到端语音大模型 ——Step-Audio-AQAA。

7/2/2025 5:00:55 PM

AI在线

硅谷 AI 人才争夺战愈发激烈：年薪千万美元抢夺顶尖科学家

硅谷AI人才争夺战白热化！Meta、OpenAI等科技巨头为顶尖AI科学家开出千万年薪，薪酬较2022年暴涨50%。#AI人才争夺战# #硅谷高薪# 报告显示，AI科学家更看重研究自由与使命，小型公司面临巨大招聘压力。

7/2/2025 4:08:18 PM

远洋

百度发布自研视频生成模型MuseSteamer及视频产品平台“绘想”

在近期的百度AIDAY科技开放日活动上，百度商业研发团队正式宣布推出两项重磅创新成果:自研视频生成模型MuseSteamer和全新的视频产品平台**“绘想”**。 MuseSteamer作为百度自主研发的视频生成模型，标志着百度在人工智能生成内容（AIGC）领域，特别是在视频创作方面取得了重要进展。而同步发布的视频产品平台“绘想”，则将为用户提供一个集成化的工具，有望降低视频创作门槛，提升内容生产效率。

7/2/2025 3:00:55 PM

AI在线

AI 冲击就业：报告称 2025 英国初级职位招聘数较 2022 年降低 32%

据Adzuna的数据显示，自2022年ChatGPT发布以来，英国初级职位的数量下降了三分之一。非技术或专业化程度较低的工作，如客户服务，面临被AI替代的最大风险。

7/2/2025 11:52:27 AM

故渊

OpenAI 启动高端企业 AI 咨询服务客户收费至少 1000 万美元

据 The Information 报道，OpenAI 正在加大其企业 AI 咨询业务的力度，收费标准至少为每位客户1000万美元。公司工程师直接与各组织合作，调整如 GPT-4o 等模型以适应其特定数据，并构建定制应用程序，包括聊天机器人等。这一举措使 OpenAI 与诸如 Palantir 和 Accenture 等知名企业展开直接竞争。

7/2/2025 11:00:54 AM

AI在线

Capital One 借助 AI 技术革新汽车销售模式

在近期的 VB Transform 大会上，Capital One 的 AI 基础技术负责人 Milind Naphade 分享了他们如何通过构建智能代理平台来推动汽车业务的发展。 Naphade 指出，该公司在15个月前开始设计这些智能代理，目标是使其具有人类代理的特点，能够与客户进行有效的沟通与问题解决。图源备注：图片由AI生成，图片授权服务商Midjourney为了实现这一目标，Capital One 在设计其智能代理时借鉴了自身的运营模式。

7/2/2025 10:00:54 AM

AI在线

震惊！OpenAI创始人透露：这是人类历史上创业最好的时代，但99%的人都理解错了

Hi，大家好，我叫秋水，当前专注于 AI Agent（智能体）。你有没有想过，为什么有些人能在短短几年内从默默无闻变成改变世界的人？近期，我看到了OpenAI的创始人Sam Altman的访谈，这个34岁就创造出ChatGPT、估值千亿美元公司的男人，说了一句让所有人震惊的话："这是人类历史上，创业最好的时代！

7/2/2025 9:56:06 AM

秋水

大模型时代，通用视觉模型将何去何从？

过去几年，通用视觉模型（Vision Generalist Model，简称 VGM）曾是计算机视觉领域的研究热点。它们试图构建统一的架构，能够处理图像、点云、视频等多种视觉模态输入，以及分类、检测、分割等多样的下游任务，向着「视觉模型大一统」的目标迈进。然而，随着大语言模型 LLM 的迅猛发展，研究热点已经悄然发生转移。

7/2/2025 9:17:13 AM

OpenAI CEO 奥特曼发声：Meta 挖角无损核心团队，承诺薪酬调整

近日，OpenAI 首席执行官萨姆・奥特曼（Sam Altman）对 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)在人工智能领域的挖角行为进行了公开回应。奥特曼表示，尽管 Meta 招募了一些优秀人才，但 OpenAI 仍然拥有其核心的顶尖团队，未受到实质性影响。在周一的一份内部声明中，奥特曼明确表示，选择留在 OpenAI 对那些志在打造通用人工智能(AGI)的人来说是最明智的决定。

7/2/2025 9:00:44 AM

AI在线

Meta抄袭DeepSeek大翻车？硅谷大佬爆料亮点满满，AI军备烧钱真相震碎硅谷

谁会首先到达ASI（超级智能）？大佬斩钉截铁的回答，让主持人惊呆了几秒。 GPT-4.5到底哪里出了问题？

7/2/2025 8:47:00 AM

o3通关「俄罗斯方块」，碾压Gemini夺冠！UCSD新基准击碎宝可梦

谁能想到，作为童年回忆的宝可梦，现在竟摇身一变，成了大模型的试金石！在无数人的童年记忆中，《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。然而，要真正通关这款游戏，仍然需要缜密的规划和大量的时间投入。

7/2/2025 2:45:00 AM

新智元

小扎官宣Meta超级智能实验室，11 位 OpenAI / Anthropic 大牛火线加盟（七位华人）

据彭博社报道，Meta CEO扎克伯格宣布，对公司人工智能部门进行全面重组，成立“Meta超级智能实验室”（Meta Superintelligence Labs，简称MSL），目标是研发能够匹敌甚至超越人类的AI系统。他在内部备忘录中表示：“超级智能的实现已经开始进入视野。我相信这将是人类新纪元的开始。

7/2/2025 1:40:00 AM

人人都能轻松建模！4款大厂出品的AI建模工具深度测评

随着生成式 AI 技术的飞速发展，3D 内容创作正迎来前所未有的变革。无论是游戏开发、影视动画、AR/VR、还是产品设计，3D 建模的时间和技术门槛一直是设计流程中的痛点。而现在，基于 AI 驱动的 3D 生成工具，正成为越来越多设计师和开发者的新利器。

7/2/2025 12:14:57 AM

58UXD 团队

保姆级教程！超详细的AI做图全流程案例演示

今天给大家带来一个 APP 风格相机元素的设计，先来看图效果：效果很不错吧？马上给大家拆解制作步骤！往期教程：.

7/2/2025 12:06:02 AM

菜心¹

AI实战案例：快速实现快递查询助手！

昨晚直播，咱们用 RAG（Retrieval-Augmented Generation，检索增强生成）实现了数据库 AI 助手，今天我们准备换一个技术使用 function call 来实现快递 AI 助手。执行效果快递 AI 助手的业务逻辑很清晰，就是我通过 LLM 大语言模型的对话来查询我的快递详情，例如，我问 AI 我有几个“运送中”的快递，他把这些快递查询并展示出来，效果如下图所示：什么是 function call？定义： Function Call（也称为 Tool Call）它允许大模型与一组 API 或工具进行交互，从而增强其功能。

7/2/2025 12:00:00 AM

苹果自研AI被爆失败！Siri拟换脑：GPT与Claude决胜负！后者开出天价：年费数十亿才给用，年年涨价！网友：这下苹果尴尬了

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）OpenAI和Claude的新一轮战争打响了！这一次是争夺苹果Siri！苹果终于放弃了幻想，已正式启动外部模型招标，为 Siri 提供 AI 支持。

7/1/2025 6:04:22 PM

伊风

OpenAI要抛弃英伟达？紧急辟谣：转向谷歌TPU是乌龙，根本无部署计划！满血版芯片谷歌自留，OpenAI被迫搞自研今年就流片！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）“OpenAI转向谷歌芯片”？这事恐怕真被大家误会了。几天前，路透社爆出猛料——知情人士称，OpenAI 已经开始租用谷歌的 AI 芯片 TPU，用来支撑 ChatGPT 和其他产品的运行。

7/1/2025 12:22:17 PM

伊风

OpenAI：正对谷歌 TPU 进行早期测试，暂无大规模部署计划

AI 硬件从实验室测试到大规模商用部署间仍有一段路要走。OpenAI 也在开发自研 AI ASIC。

7/1/2025 10:27:05 AM

溯波（实习）

资讯热榜

深度测评！谷歌全新AI模型Nano Banana（附30+提示词案例） AI 安全测试揭示聊天机器人助长恐怖活动与网络犯罪亿万富翁丹・洛布减持台积电，转投另一家万亿人工智能公司手把手教程！不写一行代码，开发鸿蒙应用，赚1万收入！中国企业大模型市场爆发:半年调用量暴增363%，阿里通义居首位美团首个开源大模型正式发布！LongCat-Flash-Chat能否撼动AI格局？对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破视觉中国重磅升级！AI生成内容标识系统全面上线

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 Anthropic 英伟达论文 AI新词代码训练算法 Stable Diffusion LLM 芯片蛋白质腾讯开发者 Claude 苹果生成式 AI for Science Agent 神经网络 3D 机器学习研究 xAI 生成人形机器人 AI视频计算百度 Sora GPU 华为 AI设计工具 RAG 大语言模型搜索字节跳动具身智能大型语言模型场景深度学习预测视频生成伟达视觉 Transformer AGI 架构亚马逊神器推荐 Copilot 特斯拉应用 DeepMind

文章列表

开源端到端语音大模型Step-Audio-AQAA：听懂音频直接生成自然语音

硅谷 AI 人才争夺战愈发激烈：年薪千万美元抢夺顶尖科学家

百度发布自研视频生成模型MuseSteamer及视频产品平台“绘想”

AI 冲击就业：报告称 2025 英国初级职位招聘数较 2022 年降低 32%

​OpenAI 启动高端企业 AI 咨询服务 客户收费至少 1000 万美元

Capital One 借助 AI 技术革新汽车销售模式

震惊！OpenAI创始人透露：这是人类历史上创业最好的时代，但99%的人都理解错了

大模型时代，通用视觉模型将何去何从？

OpenAI CEO 奥特曼发声：Meta 挖角无损核心团队，承诺薪酬调整

Meta抄袭DeepSeek大翻车？硅谷大佬爆料亮点满满，AI军备烧钱真相震碎硅谷

o3通关「俄罗斯方块」，碾压Gemini夺冠！UCSD新基准击碎宝可梦

小扎官宣Meta超级智能实验室，11 位 OpenAI / Anthropic 大牛火线加盟（七位华人）

人人都能轻松建模！4款大厂出品的AI建模工具深度测评

保姆级教程！超详细的AI做图全流程案例演示

AI实战案例：快速实现快递查询助手！

苹果自研AI被爆失败！Siri拟换脑：GPT与Claude决胜负！后者开出天价：年费数十亿才给用，年年涨价！网友：这下苹果尴尬了

OpenAI要抛弃英伟达？紧急辟谣：转向谷歌TPU是乌龙，根本无部署计划！满血版芯片谷歌自留，OpenAI被迫搞自研今年就流片！

OpenAI：正对谷歌 TPU 进行早期测试，暂无大规模部署计划

OpenAI 启动高端企业 AI 咨询服务客户收费至少 1000 万美元