AIGC宇宙 AIGC宇宙

文章列表

刚刚,OpenAI开启语音智能体时代,API价格低至每分钟0.015美元

今天凌晨,OpenAI 突然开启了新产品发布直播,这次新发布的内容全是音频模型。 据介绍,它们实现了新的 SOTA 水平,在准确性和可靠性方面优于现有解决方案——尤其是在涉及口音、嘈杂环境和不同语速的复杂场景中。 这些改进提高了语音 / 文本转录应用的可靠性,新模型特别适合客户呼叫中心、会议记录转录等用例。
3/21/2025 10:36:00 AM
机器之心

李开复预测:中国大模型未来或只剩DeepSeek、阿里和字节跳动三大巨头

在人工智能行业的快速发展中,国内市场的格局正在发生剧烈变化。 零一万物的创始人兼首席执行官李开复在一档对话节目中发表了他的看法,指出随着 DeepSeek 的崛起,中国市场未来可能只会留下三家主要的 AI 模型公司:DeepSeek(深度求索)、阿里巴巴和字节跳动。 李开复强调,DeepSeek 的影响力正在重塑整个行业的发展模式,甚至可能让 OpenAI 的创始人感到不安。
3/21/2025 9:29:00 AM
AI在线

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

RAG(五)BGE-M3,最流行的开源text embedding模型

项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。
3/21/2025 7:00:00 AM
Glodma

被低估的谷歌?聊聊Gemini 2.0最近3个超酷的新功能

Google 最近的动作真的多。 感觉就是趁着 OpenAI 存粮打完了,疯狂的撒豆子一样往外面撒更新。 昨天晚上 11 点多,他们又发了一个关于 Gemini 的更新(其实功能礼拜天就上了,我也不知道他们为啥今天才发推文)。
3/21/2025 12:11:04 AM
数字生命卡兹克

长沙推出 “超智融合” 基础教育大模型 助力智能教学新模式

近日,长沙数字集团与国家超级计算长沙中心联合推出了 “超智融合” 国产 DeepSeek 基础教育大模型,标志着人工智能在教育领域应用的新突破。 这一创新性大模型已在长郡中学和珺琟教育集团同步上线,旨在通过高效的算力和智能算法,提供全面的教育支持。 “超智融合” 大模型的核心理念是通过 “算力支撑、算法优化、数据驱动” 三位一体的方式,全面提升教育服务的智能化水平。
3/20/2025 5:53:00 PM
AI在线

支持大模型百花齐放,推进全面智能化战略:华为中国合作伙伴大会2025召开

华为正计划今年在计算产业伙伴中将重点发展 IT 类伙伴,包括构建计算经销商伙伴体系,并新增大模型一体机伙伴,计划今年发展十几家大模型伙伴。
3/20/2025 5:17:00 PM
新闻助手

上海浦东聚焦人形机器人与大模型技术,力图打造创新产业园区

近日,上海浦东新区召开了一场市政府新闻发布会,副区长李慧在会上表示,浦东将全面发力,聚焦人形机器人、大模型以及生物制造等前沿科技领域,致力于构建一批具有特色的产业园区地标。 这一举措不仅展现了浦东在全球投资环境中的战略眼光,也为未来的科技创新奠定了坚实的基础。 李慧指出,浦东将加强与企业的沟通,了解市场需求,以强化各类要素的支持。
3/20/2025 4:53:00 PM
AI在线

李开复:在 DeepSeek 掀起的变革下,三家中国公司和四家美国公司将主导 AI 行业

他看好 DeepSeek、阿里巴巴和字节跳动在中国市场的领先地位,并预计xAI、OpenAI、谷歌和 Anthropic 四家公司将主导美国市场。
3/20/2025 3:32:00 PM
清源

ChatGPT 生成诽谤性虚假谋杀信息,OpenAI 在欧洲遭隐私投诉

OpenAI的ChatGPT因生成虚假谋杀信息在欧洲遭隐私投诉,引发对AI数据准确性的担忧。隐私权益组织Noyb支持挪威个人发起投诉,质疑OpenAI是否违反欧盟《通用数据保护条例》。#ChatGPT##隐私保护#
3/20/2025 3:26:10 PM
远洋

阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控

今年 2 月阶跃星辰开源了两款 Step 系列多模态大模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,今天阶跃星辰继续开源图生视频模型 ——Step-Video-TI2V,一款基于 30B 参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。
3/20/2025 3:19:58 PM
远洋

ChatGPT 因“诽谤性”捏造儿童谋杀故事遭隐私投诉

OpenAI 最近面临了一起来自挪威的隐私投诉,主要针对其人工智能聊天机器人 ChatGPT 经常产生虚假信息的问题。 这起案件由隐私权倡导组织 Noyb 支持,投诉者是一位名为阿尔夫・哈尔马尔・霍尔门的个人。 他发现 ChatGPT 竟然错误地声称他因谋杀两个孩子和试图杀死第三个孩子而被定罪,令他感到震惊和愤怒。
3/20/2025 2:39:00 PM
AI在线

国产深海小型机器人成功实现万米深海多模态运动,登上国际学术顶刊

近日,由北京航空航天大学联合中国科学院深海研究所及浙江大学共同研发的深海小型多模态机器人,成功在国际学术顶刊《科学・机器人》上发表。 这款机器人在海洋探索和科研领域具有里程碑式的意义,特别是在深海环境下的应用。 这款深海机器人长不到50厘米,重量仅为1500克,令人惊叹的是,它能在深达万米的海底进行多模态运动。
3/20/2025 2:33:00 PM
AI在线

谷歌Chrome浏览器即将整合Gemini AI助手,操作更便捷!

在互联网科技的快速发展中,谷歌 Chrome 浏览器又将迎来一项重要更新。 根据科技媒体 Windows Latest 的最新消息,谷歌计划将其 Gemini 人工智能助手深度整合进 Chrome 浏览器,这一举措将让用户享受到更便捷的在线体验。 Gemini AI 助手的整合将类似于微软 Edge 浏览器中的 C opilot 功能。
3/20/2025 2:07:00 PM
AI在线

HuggingFace、a16z向白宫谏言,激辩OpenAI:开源才是美国最大的AI竞争优势,垄断不是!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。 不过这也只是提议,包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中,越来越多地呼吁对人工智能进行最低限度的监管,而Hugging Face则向特朗普政府提出了截然不同的观点:开源和协作的人工智能开发可能是美国最强大的竞争优势。 目前,Hugging Face已经在自家平台上拥有超过 150 万个公共模型,它已向白宫人工智能行动计划提交了建议,认为开源模型的最新突破表明,它们可以以极低的成本达到甚至超越封闭商业系统的能力。
3/20/2025 1:07:11 PM
言征

OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元

比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM

深圳发布打造人工智能先锋城市项目扶持计划操作规程

深圳市工业和信息化局正式印发了《打造人工智能先锋城市项目扶持计划操作规程》,该规程旨在推动深圳市人工智能产业的高质量发展。 此计划将重点关注算力支撑、基础数据、人工智能软件及服务等领域,涵盖了多项扶持项目,助力人工智能生态的发展。 图源备注:图片由AI生成,图片授权服务商Midjourney其中,最引人关注的是 “模型券” 项目。
3/20/2025 11:43:00 AM
AI在线

高阶玩家专属?OpenAI发布O1-Pro推理模型,百万Token定价高达600美元

OpenAI今日发布官方消息,宣布推出其最新的高性能推理模型O1-Pro。 OpenAI表示,该模型在性能和表现上均有显著提升,目前已向部分选定的开发者开放使用。 据OpenAI介绍,O1-Pro模型可供位于1至5层的特定开发者使用,并具备强大的功能,包括支持视觉输入、函数调用和结构化输出,同时能够与OpenAI的响应和批处理API无缝协作。
3/20/2025 11:08:00 AM
AI在线