文章列表

分类

标签

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 8:42:00 AM

新智元

一文读懂开源 Llama 4 模型

Hello folks，我是 Luga，今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。在人工智能领域，随着技术的不断进步，越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型，凭借其卓越的性能和创新的架构设计，成为了当前 AI 领域的焦点之一。

4/7/2025 8:40:00 AM

Luga Lee

大模型技术发展到今天，其功能可以说是日新月异；并且很多企业已经在探索大模型的应用场景和技术实现；但是很多人到现在对大模型的了解仅仅只限于能聊个天，问个问题。但实际上，大模型能够做的事要远比我们想象中的要多的多；因此，今天我们就从用户和技术两个角度来介绍一下大模型的应用。关于大模型的分类和应用问题如果想弄清楚大模型是怎么使用的，首先要知道大模型的分类；不同类型的模型适合不同的应用场景，其功能和实现也各不相同。

4/7/2025 8:15:00 AM

DFires

吉卜力风格 AI 图刷屏之际，消息称 OpenAI 正测试 GPT-4o 生图模型水印

消息人士也称，OpenAI近期确实开始尝试在免费账户生成的图片中加入水印。而只要订阅了 ChatGPT Plus，就可以保存没有水印的图像。

4/7/2025 8:00:33 AM

清源

实测700多张图！深度测评最懂设计的AI生图模型：Ideogram 3.0

大家好，我是言川。最近 GPT-4o 发布的图像功能太炸裂了，整个圈子里都是 4o 生成的作品。但我要告诉大家的是，就在 GPT-4o 图像功能发布的第二天，有一款图像模型也升级了。

4/7/2025 7:33:05 AM

言川Artie

Llama 4开源王者归来！推理、编码打平DeepSeek V3但参数减一半，一张H100就能跑，还有巨兽2万亿参数模型！

编辑 | 李美涵出品 | 51CTO技术栈（微信号：blog51cto）深夜，Meta如期发布了全新的开源大型模型系列——Llama 4，并未出现任何“跳票”传闻中的推迟情况！图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示：表示：“今天开启了原生多模态AI创新的新时代”。

4/7/2025 7:00:00 AM

李美涵

模态编码器|EVA改进之EVA-02

来自智源曹越团队在EVA的优化改进方面的工作EVA-02，项目地址：：在CV领域，训练、调优和评估非常大的视觉模型需要大量的计算资源，限制了许多研究人员和开发者的参与。因此，本研究主要目的是提供一种高效且性能强大的预训练方法，不仅能够在多种下游任务中展现出色的迁移学习能力，而且还能显著减少参数数量和计算成本。 01、模型架构EVA-02的基础是一个改进版的纯Transformer架构，该架构在原始ViT的基础上进行了若干重要的修改，以更好地适应大规模预训练任务的需求。

4/7/2025 6:30:00 AM

Goldma

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

Deepseek在2025年1月颠覆了全球人工智能模型，但谷歌和OpenAI很快发布了Gemini2 Pro和O3。这就产生了一个问题，应该使用哪种人工智能模型来进行客户服务？为了评估这些模型在客户服务任务上的表现，我们必须更深入地了解它们在各种AI基准上的表现。

4/7/2025 5:00:00 AM

晓晓

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。图片论文地址：，强化学习（RL）已广泛应用于LLM的大规模后训练阶段。

4/7/2025 3:44:00 AM

新智元

模态编码器|CLIP详细解读

下面来详细了解一下多模态大模型模态编码器部分。今天首先来看下CLIP，OpenAI发表在2021年ICML上的一篇工作。项目地址：：在自然语言处理（NLP）领域，通过大规模的文本数据预训练模型（如GPT-3）已经取得了显著的成果，但在计算机视觉领域，预训练模型仍然依赖于人工标注的图像数据集，严重影响了其在未见类别上的泛化性和可用性（需要用额外的有标注数据）。

4/7/2025 3:30:00 AM

Goldma

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

群组相对策略优化（Group Relative Policy Optimization，GRPO）已被证明是一种有效的算法，可用于训练大语言模型（LLMs），使其具备推理能力并在基准测试中持续提升性能表现。 DeepSeek-R1 展示了如何通过监督式微调（Supervised Fine-Tuning）与 GRPO 技术的结合，引导模型达到与 OpenAI 的 o1 等顶尖模型相竞争的水平。为了进一步探索其实践应用，我们尝试将这些技术应用于现实场景中。

4/7/2025 2:25:00 AM

DeepSeek AI时代下，数字化转型的本质：拼的不是技术了，是人

你见过多少数字化转型的尝试，最终变成了买软件、堆硬件的采购工程？又有多少企业花了大价钱引入先进系统，却发现员工仍在用Excel表格手动录入数据？数字化转型已成为每个企业的必修课，但成功率却惊人地低。

4/7/2025 1:00:00 AM

大数据AI智能圈

DeepSeek再好，还得先进行数据清洗！

数据分析师的日常，有大半时间都在和数据"搏斗"。每当接到一份数据，第一反应往往是叹气： "这数据质量...又得清洗半天。 " 数据清洗就像是数据分析的"地基工程"，地基不牢，上层再漂亮也会坍塌。

4/7/2025 12:30:00 AM

C#搞AI？用ML.NET实现ChatGPT本地化部署！代码全开源

在人工智能蓬勃发展的当下，ChatGPT这类大型语言模型吸引了全球目光。它强大的自然语言处理能力，能实现智能对话、文本生成等多种功能。但在实际应用中，出于数据安全、网络限制等因素考量，将ChatGPT本地化部署成为众多开发者的迫切需求。

4/7/2025 12:22:00 AM

conan

多模态模型结构与训练总结

01、模型结构一般的多模态模型架构包含5个部分，分别是：模态编码器、输入映射器、大模型骨干、输出映射器以及模态生成器。模态编码器（Modality Encoder, ME）将多种模态输入编码成特征表示，公式如下X表示模态，表示各种预训练好的编码器。目前模态主要分为：视觉模态、语音模态、3D点云模态，其中视觉模态主要包括图像和视频，对于视频，视频通常被均匀采样成5帧图像，然后进行与图像相同的预处理。

4/7/2025 12:00:00 AM

Goldma

OpenAI 的新 GPT-4o 图像生成技术绝对会改变游戏规则

GPT-4o 的图像生成功能刚刚发布就直接开始摧毁传统行业，甚至让 OpenAI 的 CEO 山姆·奥特曼（Sam Altman）都直呼：“我也看不懂眼前发生的一切！ ”图片传统的设计软件，比如 Photoshop，现在可真是如临大敌了。一、图像融合的能力彻底超越传统工具来看一个让人震惊的图像融合实例：图片传统的 Photoshop 顶多就是简单地将人物图层叠加到背景图上，对光影和角度的细节通常还要手动调整。

4/7/2025 12:00:00 AM

dev

OpenAI 遭实锤：研究称其 AI 模型“记住”了受版权保护的内容

华盛顿大学等研究为OpenAI用受版权保护内容训练模型指控提供依据。研究人员用新方法测试，发现GPT - 4记住部分小说和《纽约时报》文章内容。#OpenAI版权争议#

4/6/2025 8:23:40 AM

远洋

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

Meta推出Llama 4系列AI模型，含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick，性能各有亮点。#Meta #Llama4系列AI模型#

4/6/2025 5:34:53 AM

漾仔

资讯热榜

中国企业大模型市场爆发:半年调用量暴增363%，阿里通义居首位美团首个开源大模型正式发布！LongCat-Flash-Chat能否撼动AI格局？ Anthropic 融资 130 亿美元，估值飙升至 1830 亿美元对话顺丰科技网络安全总监梁博：大模型浪潮下物流网络安全的守与破中国AI三巨头入选《时代》周刊2025年度百强榜单苹果AI团队遭遇人才流失，核心研究员转投Meta、OpenAI和Anthropic 视觉中国重磅升级！AI生成内容标识系统全面上线入局AI4S？CPO宣布「OpenAI for Science」计划：打造下一代科学工具

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 Anthropic 英伟达 AI新词论文代码训练算法 LLM Stable Diffusion 芯片蛋白质开发者腾讯 Claude 苹果 Agent 生成式 AI for Science 神经网络机器学习 3D 研究 xAI 生成人形机器人 AI视频计算百度 Sora GPU 华为工具 RAG AI设计大语言模型字节跳动搜索具身智能大型语言模型场景深度学习预测视频生成伟达视觉 AGI Transformer 架构神器推荐亚马逊 Copilot 特斯拉 DeepMind 应用

文章列表

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！ 新智元 新智元 2025年04月04日 17:33

一文读懂开源 Llama 4 模型

大模型除了聊天还能做什么？关于大模型的分类和应用

吉卜力风格 AI 图刷屏之际，消息称 OpenAI 正测试 GPT-4o 生图模型水印

实测700多张图！深度测评最懂设计的AI生图模型：Ideogram 3.0

Llama 4开源王者归来！推理、编码打平DeepSeek V3但参数减一半，一张H100就能跑，还有巨兽2万亿参数模型！

模态编码器|EVA改进之EVA-02

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

模态编码器|CLIP详细解读

基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战

DeepSeek AI时代下，数字化转型的本质：拼的不是技术了，是人

DeepSeek再好，还得先进行数据清洗！

C#搞AI？用ML.NET实现ChatGPT本地化部署！代码全开源

多模态模型结构与训练总结

OpenAI 的新 GPT-4o 图像生成技术绝对会改变游戏规则

OpenAI 遭实锤：研究称其 AI 模型“记住”了受版权保护的内容

Meta 发布 Llama 4 系列 AI 模型，引入“混合专家架构”提升效率

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！新智元新智元 2025年04月04日 17:33