文章列表

分类

标签

DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

DeepSeek V3/ R1 火爆全网，基于原始模型的解决方案和 API 服务已随处可见，陷入低价和免费内卷。如何站在巨人肩膀上，通过后训练（post-training）结合专业领域数据，低成本打造高质量私有模型，提升业务竞争力与价值？已收获近 4 万 GitHub Star 的 Colossal-AI，发布开源大模型后训练工具箱，包含：DeepSeek V3/ R1 满血 671B LoRA 低成本 SFT 微调；完整的强化学习工具链 PPO，GRPO，DPO，SimPO 等；无缝适配 DeepSeek 系列蒸馏模型在内的 HuggingFace 开源模型；兼容支持英伟达 GPU、华为昇腾 NPU 等多种硬件；支持混合精度训练，gradient checkpoint 等训练加速降低成本；灵活的训练配置接口，支持自定义奖励函数、损失函数等；提供灵活的并行策略配置接口，包括数据并行、模型并行、专家并行、ZeRO 和 Offload 等，以适应不同硬件规模。

2/19/2025 11:56:00 AM

机器之心

Claude挣钱强于o1！OpenAI开源百万美元编码基准，检验大模型钞能力

昨天，AI 圈可以说非常热闹。中午，马斯克 xAI 发布了地表最强旗舰大模型 Grok-3；下午，DeepSeek 梁文锋亲自挂名的论文公开了全新注意力架构 NSA。这下子，OpenAI 坐不住了，推出并开源了一个真实的、用于评估 AI 大模型编码性能的全新基准 SWE-Lancer。

2/19/2025 11:53:00 AM

机器之心

德克萨斯州学生用ChatGPT写论文热度飙升，位居全美第二

在当今快节奏的数字时代，面对紧迫的学业压力，越来越多的学生选择利用人工智能工具，如 ChatGPT，来快速撰写学术论文。这种趋势的吸引力显而易见 —— 与其花费数小时撰写一篇论文，何不让 AI 在几分钟内为你生成一篇呢?图源备注:图片由AI生成，图片授权服务商Midjourney近期，MyEssayWriter.ai 进行了一项开创性的研究，通过分析过去一年间的谷歌搜索趋势，跟踪了包括 “AI 论文写作工具” 和 “如何使用 AI 撰写论文” 等30个与人工智能相关的搜索词，以确定哪些州的学生最频繁地使用 AI 来辅助写作。结果显示，德克萨斯州在这一 AI 革命中表现突出，成为全美第二大使用 ChatGPT 进行论文写作的州。

2/19/2025 11:42:00 AM

AI在线

Llama都在用的RoPE有了视频版，复旦上海AI Lab等提出长视频理解/检索绝佳拍档

Llama都在用的RoPE（旋转位置嵌入）被扩展到视频领域，长视频理解和检索更强了。复旦大学、上海AI实验室等提出VideoRoPE，并确定了将RoPE有效应用于视频所需的四个关键特性。在长视频检索、视频理解和视频幻觉等各种下游任务中，VideoRoPE始终优于先前的RoPE变体。

2/19/2025 11:28:00 AM

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

近日，微信宣布其搜索功能接入 DeepSeek-R1模型，目前处于灰度测试阶段。部分用户在微信搜索框选择 AI 搜索时，可体验到 DeepSeek-R1提供的深度思考功能。微信方面表示，引入大模型旨在提升搜索的智能化和精准度，更好地理解用户搜索意图，分析处理复杂查询。

2/19/2025 11:18:00 AM

AI在线

百度旗下小度官宣接入DeepSeek

今日，百度旗下小度正式官宣接入DeepSeek。据了解，在此之前，百度地图、百度搜索、百度 Apollo智舱大模型、文心一言、文小言App等已相继接入DeepSeek。 2月13日，百度发文透露，随着文心大模型的迭代升级和成本的不断优化，文心一言将于4月1日起全面免费开放，届时所有PC端和APP端用户都将有机会体验到文心系列的最新模型。

2/19/2025 11:16:00 AM

AI在线

小红书打击黑灰产账号，严控AI生成内容对社区的影响

近日，小红书发布了关于黑灰产账号治理的阶段性进展公告，显示该平台在过去三个月内共处理了超过320万的违规账号。这项行动旨在遏制利用 AI 生成同质化内容的黑灰产团伙，保护社区生态。小红书的治理工作从去年11月开始，专注于打击虚假营销和黑灰产养号行为。

2/19/2025 11:01:00 AM

AI在线

DeepSeek-V3深入解读！

上一篇文章对DeepSeek-R1进行了详细的介绍，今天来看看DeepSeek-R1的基座模型DeepSeek-V3。项目地址：：现有的开源模型在性能和训练成本之间往往难以达到理想的平衡。一方面，为了提升模型性能，需要增加模型规模和训练数据量，这会导致训练成本急剧上升；另一方面，高效的训练和推理架构对于降低计算资源消耗至关重要。

2/19/2025 10:49:30 AM

Glodma

谷歌Gemini重磅升级：将内置AI视频生成功能，创作更简单！

谷歌最近宣布，其 AI 助手 Gemini 将迎来一项重大升级，内置视频生成功能，这一功能正在紧锣密鼓地开发中。与谷歌之前推出的 AI 视频生成工具 Google Vids 相比，Gemini 的这一新功能显然更为强大和高效，旨在简化视频创作的流程，让普通用户也能轻松制作出精彩视频。 Gemini 的 AI 视频生成功能，将允许用户通过简单的指令或创意输入，快速生成专业水准的视频内容。

2/19/2025 10:35:00 AM

AI在线

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

AI好好用报道编辑：杨文这波「左右互搏」有看头了。腾讯向来以「慢」著称。无论是游戏、搜索还是音乐、短视频，腾讯都比其他家慢了半拍。

2/19/2025 10:27:00 AM

AI好好用

神州信息引入国产开源大模型 DeepSeek

近日，神州信息宣布引入国产开源大模型 DeepSeek，旨在实现其全栈金融解决方案的智能化升级。这一举措不仅标志着技术的迭代，也为银行客户带来了低成本且安全的私域环境部署。通过 DeepSeek 的接入，神州信息旗下九大产品线及30多款关键业务解决方案得到了智能化的全面提升，涵盖了零售客户运营、数字化渠道、开放银行、信贷业务、数据智能及企业级中台等多个领域。

2/19/2025 10:04:00 AM

AI在线

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

在最近的财报电话会上，百度创始人李彦宏就文心大模型4.5系列的开源决策进行了深入的分析。他表示，从其自主研发的 DeepSeek 项目中，百度深刻认识到开源的最佳模型将大大推动用户的使用和接受程度。当一个强大的模型实现开源时，自然会吸引更多的人出于好奇心进行尝试，这样的行为不仅能够促进技术的普及，也会带来更广泛的应用。

2/19/2025 10:02:00 AM

AI在线

OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路

OpenAI 的首席执行官 Sam Altman 近日在社交媒体平台 X 上发起了一项调查，询问用户对公司下一步开源开发方向的看法。这一举动发生在 OpenAI 正在经历重大转型的背景下，公司正将其营利部门转变为公益公司。自从获得微软投资以来，OpenAI 与开源的关系发生了显著变化。

2/19/2025 9:57:00 AM

AI在线

Gemini 或将支持视频生成?Google 应用代码泄露玄机

据国外媒体Android Authority报道，谷歌正持续为其 AI 数字助理 Gemini 增加新功能。继深度情境理解、文件处理优化以及跨应用链接等功能后，Google 应用程序中的代码表明 Gemini 很快就能生成视频。 Google 应用 v16.6.23版本代码中暗示了这一新功能。

2/19/2025 9:55:00 AM

AI在线

OpenAI 举报者之死疑云重重，家属送检有疑头发样本

OpenAI 举报者苏奇尔・巴拉吉（Suchir Balaji）的尸检报告近日已交给其家属。然而，巴拉吉的家人对其被认定为自杀的结论表示怀疑，并表示已将其公寓内发现的一根奇怪的头发样本送往实验室进行检测。图源备注:图片由AI生成，图片授权服务商Midjourney根据城市验尸官和警方联合发布的报告，调查人员在现场未发现任何证据或信息，能够确定巴拉吉的死因和方式为自杀，死因被认定为自残导致的头部枪伤。

2/19/2025 9:28:00 AM

AI在线

官宣！OpenAI前CTO新公司：北大校友翁荔加盟，创始29人2/3来自OpenAI

正式官宣！ OpenAI前CTO Mira Murati 成立新公司——Thinking Machines Lab。整个创业团队可以说前所未有之豪华了，三分之二的都是以前的OpenAI旧部追随——其中包括OpenAI前研究（后训练）副总裁Barret Zoph，担任公司CTO；刚刚离职Anthropic、OpenAI离职联创John Schulman，任公司首席科学家，还有包括前OpenAI VP、北大校友翁荔等等。

2/19/2025 9:20:30 AM

量子位

小红书重点打击黑灰产团伙用AIGC大模型大规模矩阵养号行为

日前，小红书发布了最新的 “黑灰产账号治理阶段进展公告”，宣布在过去三个月内，共计处置了超过320万的黑灰产账号。根据公告，截至2023年2月17日，小红书的 “薯管家” 团队在治理过程中，发现并处理了401个拥有10万以上粉丝的账号，以及9215个拥有1万以上粉丝的账号。这表明黑灰产账号在社区内的影响力不容小觑。

2/19/2025 9:16:00 AM

AI在线

Deepseek 这么厉害，普通人怎么用好它？

最近，Deepseek 的风头可谓是一时无两，相关消息一波接着一波。它强大的能力让人惊叹不已，写代码、做翻译、生成文案……简直无所不能！不少小伙伴跃跃欲试，却又担心自己不是程序员、不会写代码，用不好这么“高大上”的工具。

2/19/2025 8:50:05 AM

架构精进之路

资讯热榜

OpenAI发布企业AI浪潮领先指南：十大核心洞察 OpenAI 挥剑指向 LinkedIn，将于2026年推出 AI 招聘平台华纳兄弟发起 “反击战”：起诉AI图像生成公司Midjourney 谷歌新 AI “Nano Banana” 一周吸引千万用户，图像编辑轻松搞定！ OpenAI 推出 AI 招聘平台，计划与 LinkedIn 竞争玩出新花样！教你用Lovart + Nano Banana无脑批量制作知识卡片海报！ KakaoTalk将集成ChatGPT功能韩国聊天应用迎来AI升级 MIT 报告揭示 95% 企业 GenAI 项目失败，批评者称其过于简化

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 AI新词 Anthropic 英伟达论文训练代码算法 LLM Stable Diffusion 芯片腾讯蛋白质开发者 Claude 苹果 AI for Science Agent 生成式神经网络机器学习 3D 研究 xAI 生成人形机器人 AI视频计算百度 Sora 工具 GPU 华为 RAG 大语言模型 AI设计字节跳动具身智能搜索大型语言模型场景深度学习视频生成预测 AGI 视觉伟达架构 Transformer 神器推荐亚马逊特斯拉编程 Copilot MCP

文章列表

DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

Claude挣钱强于o1！OpenAI开源百万美元编码基准，检验大模型钞能力

德克萨斯州学生用ChatGPT写论文热度飙升，位居全美第二

Llama都在用的RoPE有了视频版，复旦上海AI Lab等提出长视频理解/检索绝佳拍档

微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息

百度旗下小度官宣接入DeepSeek

小红书打击黑灰产账号，严控AI生成内容对社区的影响

DeepSeek-V3深入解读！

谷歌Gemini重磅升级：将内置AI视频生成功能，创作更简单！

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

神州信息引入国产开源大模型 DeepSeek

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

​OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路

Gemini 或将支持视频生成?Google 应用代码泄露玄机

​OpenAI 举报者之死疑云重重，家属送检有疑头发样本

官宣！OpenAI前CTO新公司：北大校友翁荔加盟，创始29人2/3来自OpenAI

小红书重点打击黑灰产团伙用AIGC大模型大规模矩阵养号行为

Deepseek 这么厉害，普通人怎么用好它？

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路

OpenAI 举报者之死疑云重重，家属送检有疑头发样本