AIGC宇宙 AIGC宇宙

文章列表

OpenAI 新模型 GPT-4.1 可靠性遭质疑:独立测试显示其对齐性下降

IT之家 4 月 24 日消息,本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并声称该模型在遵循指令方面表现出色。 然而,多项独立测试的结果却显示,与 OpenAI 以往发布的模型相比,GPT-4.1 的对齐性(即可靠性)似乎有所下降。 据IT之家了解,通常情况下,OpenAI 在推出新模型时,会发布一份详细的技术报告,其中包含第一方和第三方的安全评估结果。
4/24/2025 8:29:59 AM
远洋

OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起

OpenAI宣布将ChatGPT的图像生成技术引入API,开发者可集成到应用中。新模型gpt-image-1支持多风格图像生成,嵌入水印识别AI内容。多家公司已开始测试,如Figma支持图像生成编辑。#AI生成##OpenAI#
4/24/2025 8:04:09 AM
远洋

谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿,与 ChatGPT 等竞品仍有差距

谷歌AI聊天机器人Gemini全球月活跃用户达3.5亿,日活用户从去年10月的900万增至3500万。但与ChatGPT的6亿月活相比仍有差距。谷歌通过与三星合作、集成到Workspace和Chrome等策略推动增长。#AI竞争# #谷歌Gemini#
4/24/2025 7:50:42 AM
远洋

消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类

消息称 OpenAI计划今夏初发布开源语言模型,推理能力或超越同类,采用宽松许可协议,避开争议。此举或为应对开源竞争对手如Meta的Llama和DeepSeek的压力。#AI开源# #OpenAI#
4/24/2025 7:40:18 AM
远洋

做图效率提高50%!实测GPT-4o生图效果

(友情提示:本文适合边嗦奶茶边阅读,保你喷屏时还能保持理智). 前言导语:关于 AI,设计师的「电子宠物饲养指南」. 最近设计圈仿佛上演了一出大型魔幻连续剧——第一集:《震惊!
4/24/2025 1:00:23 AM
若风

你的数据有多好,你的模型就有多强

在AI大战烽火连天的今天,所有人都在追逐参数规模的增长和架构的优化。 然而,行业内的一个秘密正在悄然成形:拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。 数据,而非算法,正成为区分强弱的决定性要素。
4/24/2025 12:40:00 AM
大数据AI智能圈

超多案例对比!Veo2和可灵2.0的AI视频生成效果哪家强?

嗨大家好! 忙了好一阵了,最近终于有时间来测试一下最新版的据说超级强的可灵 2.0,想着来都来了不如顺便就把 Veo 2 也一起测了。 前几天可灵 2.0 在北京有发布会,我没有去,主要是比较忙,最主要是可灵也没邀请我,不过还好,Veo 2 也没邀请我,让我可以非常好地保持住自己的客观。
4/24/2025 12:34:52 AM
阿真Irene

学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"

【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。 研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。 【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高,但在高采样数(k=128)时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致,RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器",它能让模型更擅长做已知的事,但难以开发新的推理路径。
4/23/2025 2:00:43 PM
AI在线

微软发布全球首个1-bit大模型:内存缩至0.4 GB,参数只有0和±1,性能追平全精度

微软的BitNet b1.58 2B4T 的技术报告悄然上线。 其实在开源社区里,关于极致低比特量化的大模型早就有各种传闻,这次微软研究院终于亮出底牌。 ——全球首个原生1-bit、规模高达20亿参数的开源大模型。
4/23/2025 12:11:40 PM
文摘菌

突发!OpenAI或将收购谷歌浏览器Chrome

今天凌晨4点,路透社消息,OpenAI一位高管在谷歌垄断案庭审中作证,将收购其浏览器Chrome。 目前,谷歌在美国正遭遇反垄断审判,如果上诉失败不仅Chrome会被拆分,其数字广告业务也会被剥离,会对谷歌进行大重组。 今天凌晨1点左右,华盛顿邮报最早报道了谷歌被起诉的消息。
4/23/2025 11:52:05 AM
AIGC开放社区

突发!OpenAI法庭自曝收购Chrome计划,被谷歌律师回怼!OpenAI曾求谷歌合作惨遭拒绝,如今想成为大厂的野心藏不住了!

编辑 | 李美涵在美国司法部对谷歌的反垄断审判中,OpenAI 的 ChatGPT 产品负责人 Nick Turley 在法庭上表示:“如果 Chrome 浏览器真的要被出售,我们 OpenAI 有兴趣出价购买! ”图片这场审判的背景是,美国司法部希望通过一系列措施,打破谷歌在在线搜索领域的垄断地位。 此前,我们曾报道过司法部要求谷歌出售 Chrome 浏览器的消息:谷歌再度被要求出售Chrome!
4/23/2025 11:40:25 AM
李美涵

​Sentra 获 5000 万美元 B 轮融资,助力企业数据安全应对 AI 时代挑战

在数据安全领域,Sentra 近日宣布成功融资5000万美元 B 轮投资,至此总融资额已超过1亿美元。 这轮融资由 Key1Capital 领投,其他知名投资者如 Bessemer Venture Partners、Zeev Ventures、Standard Investments 及 Munich Re Ventures 继续支持。 此时恰逢 AI 技术在企业中快速普及,同时也带来了大量敏感数据和新的安全风险。
4/23/2025 11:00:57 AM
AI在线

宝马将在中国新车型中引入DeepSeek人工智能

在近日于上海举行的汽车展上,德国汽车制造商宝马(BMW)宣布,将于今年晚些时候在其新车型中集成中国初创公司 DeepSeek 的人工智能技术。 宝马首席执行官奥利弗・齐普塞(Oliver Zipse)在展会上表示,这一举措标志着宝马在中国市场进一步加强与本地科技公司的合作。 齐普塞强调,中国在人工智能领域的创新步伐迅速,宝马希望借助这种技术提升其汽车的智能化水平。
4/23/2025 11:00:57 AM
AI在线

华盛顿邮报与 OpenAI 达成合作,让 ChatGPT 为用户提供优质新闻摘要

近日,《华盛顿邮报》宣布与 OpenAI 建立战略合作关系,旨在通过 ChatGPT 让用户更方便地获取高质量的新闻内容。 这一合作将使得 ChatGPT 在回答相关问题时,能够提供《华盛顿邮报》的新闻摘要、引述以及原始报道的链接,进一步提升用户的阅读体验。 根据《华盛顿邮报》的声明,此次合作的重点将集中在政治、全球事务、商业和科技等多个领域的新闻报道上。
4/23/2025 11:00:57 AM
AI在线

谷歌考虑与安卓制造商签署Gemini人工智能独家合作协议

在最近的一场反垄断审判中,曝光出谷歌的内部文件显示,该公司曾在去年考虑与多个安卓手机制造商,如三星等,达成独家合作协议。 这些协议不仅涉及谷歌的搜索应用程序,还包括其最新推出的 Gemini 人工智能应用和 Chrome 浏览器。 这一消息无疑引发了行业的广泛关注,尤其是在当前反垄断监管日益严格的背景下。
4/23/2025 11:00:53 AM
AI在线

OpenAI:如果谷歌被迫出售 Chrome,我们有意收购!

在最近于华盛进行的谷歌反垄断庭审中,OpenAI 的高管 Nick Turley 透露了一条引人注目的消息。 他表示,如果法院裁定谷歌必须剥离其 Chrome 浏览器以恢复搜索市场的竞争,OpenAI 将对此表示兴趣,愿意考虑收购 Chrome 浏览器。 这一声明不仅揭示了 OpenAI 对搜索功能的重视,也表明了该公司在未来发展中的雄心。
4/23/2025 11:00:53 AM
AI在线

OpenAI 高管在庭审中透露:若谷歌被迫出售 Chrome,将考虑收购

在最近于华盛顿举行的谷歌反垄断庭审上,OpenAI 高管 Nick Turley 引发了广泛关注。 他表示,如果法院裁定谷歌必须出售其 Chrome 浏览器以恢复搜索市场的竞争,OpenAI 将有意收购这一浏览器。 此次庭审是因法官在2024年裁定谷歌在在线搜索及相关广告市场具有垄断地位而引发的,尽管谷歌表示计划上诉,但庭审却揭示了生成式人工智能领域内的激烈竞争。
4/23/2025 11:00:52 AM
AI在线

Agent 要被吃进大模型了

今天凌晨,奥特曼突然发文宣布推出自家最新的 o 系列模型:满血版 o3 和 o4-mini,同时表示这两款模型都可以自由调用 ChatGPT 里的各种工具,包括但不限于图像生成、图像分析、文件解释、网络搜索、Python。 总的来说,就是比前一代的性能更强而且价格更低。 消息一出,马上就有网友晒出了两个模型的“小球测试”结果,并配文:“这确实是迄今为止看到的最好的测试结果了。
4/23/2025 10:50:00 AM
郑佳美