AIGC宇宙 AIGC宇宙

理论

ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道

昨晚,奥特曼一则预告帖,浏览破200多万,彻底点燃了全网大猜想。 而让他兴奋到睡不着的,竟是ChatGPT增强了记忆能力! 图片图片从今天起,ChatGPT记忆功能可以参考过去所有聊天记录,提供更加个性化回复。
4/11/2025 10:32:39 AM

ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制

ChatGPT可以引用过去所有聊天了! 刚刚,OpenAI发布ChatGPT新能力,支持参考过去所有对话内容,更好根据个人喜好来生成回复。 除了保存此前记忆,还能引用过去内容。
4/11/2025 8:51:51 AM

大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。 在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。 其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
4/10/2025 2:30:12 PM
清源

GPT开山一作,本科学历入职前CTO初创!OpenAI痛失「爱因斯坦级天才」

被Ilya感谢过,被奥特曼誉为「爱因斯坦级的天才」,在OpenAI更是「想要什么就给什么」——即便如此,去年12月,Alec Radford还是选择了离开。 直到昨天,他的去向才确定。 据Thinking Machine Lab官网更新,OpenAI前核心成员Alec Radford和Bob McGrew将担任公司顾问(Advisors)。
4/10/2025 9:00:00 AM
新智元

算法面试80%会问:大模型评估指标全解析

从训练到部署的评估链条大模型的评估贯穿了从研发到部署的全生命周期:训练阶段:使用交叉熵等损失函数指导模型优化方向生成评估:通过BLEU、ROUGE等指标量化生成内容质量能力测试:利用GLUE、MMLU等标准化基准评估多维度能力实战对比:在竞技场上与其他模型直接PK,检验实际效果交叉熵与困惑度熵最初源自物理学,用于描述系统无序程度。 在信息论中,熵衡量信息的不确定性:$H(X) = -\sum_{x} P(x)log_b P(x)$交叉熵是评估预测分布与真实分布差异的指标,也是大模型训练中最常用的损失函数:$H(p, q) = -\sum_{i} p(i) \log q(i)$困惑度是评估语言模型的老牌指标,简单说就是预测下一个词有多"困难"。 计算公式:复制在实际项目中,我们常用它监控预训练过程。
4/10/2025 7:00:00 AM
贝塔街的万事屋

你的AI政策中应该包含的十件事

从理解AI在企业环境中的含义,到确保合规性,再到不忘第三方所扮演的角色,以下是制定AI政策时需要牢记的十个关键点。 GenAI的流行给企业带来了一个棘手的局面。 一方面,这是一种具有降低成本和增加收入潜力的颠覆性技术,另一方面,AI的滥用可能会颠覆整个行业,引发公关灾难、客户和员工的不满,以及安全漏洞。
4/10/2025 7:00:00 AM
Maria Korolov

阿里云刘伟光:AI正在推动各行各业的生产力变革

“阿里云大模型的战略就是服务企业市场创造社会价值,AI正在推动各行各业的生产力变革,通义大模型将深耕企业市场。 ”4月9日,阿里云在京召开AI势能大会,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称,大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。 近一年多来,通义大模型技术加速迭代,在to B和to C赛道都取得了一些进展,在消费端表现为用户体验的优化,在产业侧表现为生产力的极大提升。
4/9/2025 2:35:50 PM

Coze工作流×DeepSeek二创引擎!抖音/小红书/公众号链接秒变飞书表格,日省8小时

前言在短视频与图文内容井喷的今天,创作者面临信息过载、二创合规性困境及多平台适配壁垒。 跨平台爆款内容分散于不同生态,人工搬运低效且素材利用率不足20%。 直接搬运面临限流风险,而人工改写效率低下,难以平衡原创度与爆款基因。
4/9/2025 9:50:00 AM
后端小肥肠

"是我创造了第一个LLM"!Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方:哥们,是我创造了第一个大语言模型。 发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家,现answer.ai与fast.ai创始人,。 事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。
4/9/2025 9:23:00 AM
量子位

当 C# 遇上 ChatGPT:自动生成高质量单元测试代码实践

在软件开发的漫长旅程中,单元测试是确保代码质量的关键防线。 传统上,开发人员需要耗费大量时间和精力手动编写单元测试代码,这不仅考验开发者对业务逻辑的理解,还要求熟悉各种测试框架和技巧。 随着人工智能技术的飞速发展,ChatGPT等大型语言模型的出现为这一繁琐工作带来了新的解决方案。
4/9/2025 8:55:00 AM
conan

一文彻底搞懂 MCP:AI 大模型的标准化工具箱

MCP 最近在 AI 领域 引发了 广泛关注,特别是在 海外各大社区 中,大家热烈讨论,热度相当高。 我打开了 Google Trends[1],这是一个专门用于查看全球热点趋势的网站。 图片输入关键词后,可以查看其热度变化。
4/9/2025 8:25:20 AM
程序员NEO

深度干货:DeepSeek+Dify强强联合,打造企业专属私有化AI知识库

在数字化转型的浪潮中,人工智能正以前所未有的速度渗透到企业运营的各个环节。 尤其对于算力需求旺盛的企业,例如那些关注Nvidia GPU、A800、H100等高性能计算资源的公司,以及积极探索AI Agent(如AutoGen、Devin AI)和低代码平台潜力的组织,如何安全、高效地利用AI提升内部知识管理和对外服务能力,成为其保持竞争力的关键。 本文将深入探讨如何通过DeepSeek强大的语言模型,结合Dify便捷的AI应用开发平台,构建一个私有化部署的企业知识库,为企业带来更智能、更安全、更高效的知识管理体验。
4/9/2025 8:00:46 AM
康焕新

AI图片泛滥怎么管?OpenAI计划给AI图像添加水印

随着生成式人工智能的高速发展,AI图像正以前所未有的速度在网络上传播。 从AI创作“宫崎骏风格”动画图,到仿真度极高的商品广告照、新闻配图,普通用户只需输入一句话,便可秒产专业级画面。 这种“视觉洪流”的背后,是OpenAI等技术巨头不断推陈出新的图像生成模型——其中最先进的,莫过于不久前发布的ChatGPT-4o内嵌的ImageGen。
4/9/2025 8:00:00 AM

斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔

就在刚刚,每年都备受瞩目的斯坦福AI指数报告,重磅发布了! 这份报告由斯坦福大学以人为本AI研究员发布,代表着每年AI领域最核心和前沿的动向总结。 今年,这份报告长达456页,抛出不少惊人观点。
4/9/2025 4:22:00 AM
新智元

模态编码器 | CLIP改进之SigLIP,采用sigmoid损失的图文预训练

DeepMind对CLIP改进的一篇工作--SigLIP,发表在2023CVPR。 简单看下研究动机:传统的对比学习方法如CLIP等依赖于 softmax 归一化,这需要一个全局视角来计算成对相似度,从而限制了批处理大小的扩展能力,并且在小批处理大小下表现不佳。 因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练(SigLIP)。
4/9/2025 2:10:00 AM
Goldma

大模型+数据分析:下一代智能查询优化体系的先行探索

当你每天面对万亿级数据、日均百万次查询请求时,你会怎么做?  处理海量数据查询犹如在迷雾中寻路,方向稍有不慎就会迷失。 数据负载高到屏幕只显示超时,查询速度慢到让你有时间泡一杯咖啡再来检查结果。
4/9/2025 1:00:00 AM
大数据AI智能圈

ChatGPT的危险之处:你永远不应该告诉AI机器人的五件事

但这个征服世界的大型语言模型聊天机器人被描述为一个“隐私黑洞”,人们担心它处理用户数据的方式,这甚至导致它在意大利被短暂封禁。 它的创造者OpenAI毫不掩饰这样一个事实:任何输入的数据都可能不安全。 这些数据不仅可能被用于进一步训练其模型,从而可能暴露给其他用户,而且还可能被人工审核,以检查其是否符合使用规则。
4/9/2025 12:13:00 AM
Bernard Marr

大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略

一、Ollama 是什么? Ollama 是一个开源的本地大模型部署工具,旨在简化大型语言模型(LLM)的运行和管理。 通过简单命令,用户可以在消费级设备上快速启动和运行开源模型(如 Llama、DeepSeek 等),无需复杂配置。
4/8/2025 3:22:00 AM
wayn