文章列表
大模型超强内存优化:成本削减高达75%,性能不减弱!成果出自日本一初创AI公司之手;网友:电力可能够用了!
出品 | 51CTO技术栈(微信号:blog51cto)一项逆天的大模型优化技术来了! 东京初创公司Sakana AI的研究人员开发了一种新技术,让大模型能够更有效地使用内存,不仅最多节省75%的内存占用,还甚至性能也有所提升! 这种名为“通用Transformer内存”的技术使用特殊的神经网络优化LLM,保留重要的信息并丢弃冗余的细节。
12/18/2024 1:24:55 PM
谷歌逆风翻盘暴击OpenAI,90天王者归来!44页报告押注25年三大技术前沿
逆袭之战开启,谷歌用90天重回巅峰! 短短90天,谷歌就从业内笑柄,逆袭成突破最大、产品最颠覆的科技大公司。 用AI初创创始人Ole Lehmann的话说,「我们正在见证2024年最大的科技转变」。
12/18/2024 1:20:18 PM
OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等重磅更新
OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。 本次更新涵盖以下关键内容:1. API 中的 OpenAI o1:OpenAI o1 模型正式在 API 中向 5 级使用用户开放。
12/18/2024 12:20:15 PM
AI寒武纪
百度关于大模型在研发领域落地的深度思考
一、智能研发工具的发展首先来看一下智能研发工具的发展历程和方向。 智能化的发展背景与落地诉求早期的智能化工具,如 GitHub 的 Copilot 工具,大约在两年半前推出。 最初,Copilot 的主要功能是在开发者编写代码时提供自动补全建议。
12/18/2024 8:33:01 AM
张立理
碾压Sora!谷歌全新发布AI视频模型Veo2+AI绘图Imagen3
更多AI干货:. 体验完Vidu划时代的新功能,我觉得可以正式抛弃3D渲染了这两天,在 X 上看到一个很酷的 2D 动漫 AI 视频。 阅读文章 .
12/18/2024 8:02:54 AM
数字生命卡兹克
OpenAI 称目前尚无推出视频生成模型 Sora API 的计划
OpenAI 今日表示,目前没有推出其视频生成模型 Sora 的应用程序接口(API)的计划,该模型可基于文本、图像生成视频。
12/18/2024 7:37:53 AM
远洋
USENIX Sec'25 | LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了
本文介绍对 LLM 提示词注入攻击(prompt injection)的通用防御框架。 首篇论文已被安全顶会 USENIX Security 2025 接收,第一作者陈思哲是 UC Berkeley 计算机系博士生,Meta FAIR 访问研究员,研究兴趣为真实场景下的 AI 安全。 他的导师是 David Wagner (UCB), 郭川 (Meta), Nicholas Carlini (Google)。
12/18/2024 7:20:00 AM
OpenAI o1 推理模型 API 上线,仅面向特定开发者开放
“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。
12/18/2024 7:00:24 AM
远洋
零基础也能快速做海报!AI设计神器Recraft入门使用指南
Recraft,这款集成了 AI 绘画、矢量图生成和设计工具的应用平台,是一款强大的 AI 图像生成与编辑工具。 这款工具以其卓越的文本渲染、高级控制、多功能编辑和实时协作等功能,成为了设计师们不可或缺的创意助手,大大满足了设计师对于创意和效率的双重追求。 Recraft 的出色能力不仅体现在其强大的功能和便捷的操作上,更在于它能够将 AI 技术真正赋能给用户。
12/18/2024 12:32:27 AM
58UXD 团队
AI大模型时代,人才的需求已经变了
什么是 AI 发展的第一驱动力? 最近,全球科技大厂都在用行动告诉我们:人才。 本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。
12/17/2024 9:08:00 PM
机器之心
举报人「自杀」,OpenAI表示震惊!NYU教授发长文悼念:警钟仍在回响
几天前,消息曝出,曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。 Suchir Balaji曾参与了ChatGPT后训练、GPT-4预训练,以及o1推理的研发工作。 今年10月,他在自己的一篇博文和「纽约时报」的专访中指出,OpenAI在使用新闻和其他网站的信息训练其AI模型时,违反了「合理使用」原则。
12/17/2024 4:51:45 PM
新智元
宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学
9.9万元起,还能够大规模量产的国产人形机器人,表现得实在是太6了:而且还走上了开源路线,就在刚刚,宇树机器人开源的强化学习代码又更新了! 更新之后不再是只能训练——不仅能够仿真运行,还能部署到实体机器,整个过程所有代码全部开放。 一开始,宇树开源的是英伟达Issac Gym平台上的训练代码,这次新增了对MuJoCo模拟仿真的支持。
12/17/2024 1:00:00 PM
量子位
ChatGPT地位不保?科技爱好者更喜欢拥有“情绪智力”的Claude
Claude是AI企业Anthropic开发的聊天机器人,它的名气远不如ChatGPT,目标也不是让用户与逼真的AI伙伴建立关系,但它仍然给OpenAI带来一些威胁。 由于Claude很机智,很敏感,科技爱好者渐渐喜欢上Claude。 一些爱好者甚至每天要与Claude对话十几次,向它询问工作建议、健康问题、人际关系问题。
12/17/2024 12:28:06 PM
极客AI
为多模态LLM引入ControlNet理念,开源插件解决灾难性遗忘
多模态大模型内嵌语言模型总是出现灾难性遗忘怎么办? 像文生图那样有ControlNet即可解决。 这就是由360人工智能研究院提出的IAA的核心思路。
12/17/2024 12:08:21 PM
ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题
ChatGPT今天带来的是搜索功能方面的一些迭代升级(更像谷歌了)。 主要有三点,私以为最大亮点是第二:根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;免费,接下来逐步向所有ChatGPT用户开放。 官方信息显示,ChatGPT Search背后是微调后的GPT-4o模型,使用新颖的合成数据生成技术进行post-trained(包括从OpenAI o1-preview中提炼输出合成数据)。
12/17/2024 8:25:00 AM
量子位
华为诺亚解析:推荐系统的技术演进及大模型应用实践
一、推荐系统问题和背景首先来简要介绍一下个性化推荐系统。 实际上,我们每个人每天都在与众多推荐系统进行交互。 例如,购买衣物、阅读新闻或聆听音乐时,我们打开的每一个应用程序或网页,其展示的内容即为推荐系统所呈现。
12/17/2024 8:11:27 AM
刘卫文
本地构建Llama 3.2-Vision多模态LLM聊天应用实战
译者 | 朱先忠审校 | 重楼本文将以实战案例探讨如何在类似聊天的模式下从本地构建Llama3.2-Vision模型,并在Colab笔记本上探索其多模态技能。 简介视觉功能与大型语言模型(LLM)的集成正在通过多模态LLM(MLLM)彻底改变计算机视觉领域。 这些模型结合了文本和视觉输入,在图像理解和推理方面表现出令人印象深刻的能力。
12/17/2024 8:05:34 AM
朱先忠