文章列表
成本仅DeepSeek三分之一!阿里发布全球最强开源大模型Qwen3系列
小道消息一直在说,前天深夜或者昨天凌晨,阿里会发 Qwen3。 然后我特意早早的睡了一两小时,凌晨 1 点起床,就为了等 Qwen3 发。 结果这一等,就是好几个小时。
5/1/2025 1:13:13 AM
数字生命卡兹克
DeepSeek-Prover-V2-671B 模型开源,数学推理领域迎来新突破
中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。 这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。 根据社交媒体上的最新讨论,这一模型被认为是 DeepSeek 在数学领域的重要里程碑,或将推动全球 AI 研究与应用的进一步发展。
4/30/2025 6:00:51 PM
AI在线
快手All in AI视觉!成立可灵AI事业部,加速大模型商业化
4 月 30 日,快手发布组织架构调整公告,宣布正式成立可灵AI事业部,进一步强化其在人工智能领域的战略布局。 公告显示,新成立的可灵AI事业部下设可灵AI产品部、运营部和技术部,全面负责包括可灵、可图在内的系列大模型业务。 快手高级副总裁盖坤将出任可灵AI事业部负责人,并继续兼任社区科学线负责人。
4/30/2025 6:00:51 PM
AI在线
DeepSeek-Prover-V2-671B 新模型开源发布
DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。
4/30/2025 5:56:53 PM
汪淼
中国开源大模型新成员:小米推理大模型首秀!
编辑 | 云昭进入2025以来,中国大模型的开源力量一骑绝尘,甚至盖过了Llama的势头。 今天,中国开源大模型,迎来新成员! 4月30日,赶在五一前,一条“为Reasoning而生”的Xiaomi Mimo开源模型的发布消息不胫而走,发布渠道是小米6天前新注册的公众号Xiaomi Mimo。
4/30/2025 4:48:07 PM
云昭
Meta Llama AI 模型下载量突破 12 亿,开发者贡献数万个衍生模型
Meta在首届LlamaCon大会上宣布,其开源AI模型Llama下载量已达12亿次,用户近10亿。首席产品官Chris Cox透露,数千开发者贡献了数万衍生模型。与此同时,阿里巴巴Qwen3模型家族发布,形成有力竞争。#AI开源##LlamaCon#
4/30/2025 2:50:04 PM
远洋
Meta AI 独立App炸场上线!小扎力挺开源:与 DeepSeek、Qwen 一起对抗“闭源”AI
Meta又搞了个大活。 就在LlamaCon开发者大会上,这家社交巨头一口气发布了Meta AI独立App和Llama 云 API,正式把自家的AI推到了“社交 个性化 开放生态”的新维度。 图片是的,你没看错——继在WhatsApp、Instagram、Facebook、Messenger里塞满AI助手之后,Meta终于把AI单独做成了App,直接对标ChatGPT。
4/30/2025 2:12:36 PM
文摘菌
真假难辨!腾讯混元Turbo S助《太空杀》AI玩家智商飙升
社交推理游戏《太空杀》正迎来一场人和AI推理水平的大PK。 巨人网络旗下这款风靡全球的手游,通过接入腾讯混元新一代旗舰快思考模型Turbo S,使其AI玩家的智能水平实现了高度拟人化。 腾讯混元Turbo S能够同时驱动八名AI玩家参与游戏,凭借其强大的推理能力和仿真的文字对话能力,与真人玩家展开智力较量。
4/30/2025 2:00:41 PM
AI在线
蚂蚁数科发布金融智能体开发平台 Agentar,推动 AI 技术在金融领域应用
在数字中国建设峰会期间,蚂蚁数科正式推出了智能体开发平台 Agentar。 该平台旨在为金融机构提供一站式、全栈的智能体开发工具,帮助它们高效地打造具备自主决策能力、可信赖的金融智能体应用。 此次发布标志着 AI 技术从 “辅助工具” 转变为推动金融服务变革和效率提升的 “生产力引擎”。
4/30/2025 12:00:40 PM
AI在线
Meta 召开首届 LlamaCon 大会,意在对抗 OpenAI
Meta 在其位于加州门洛帕克的总部举行了首届人工智能开发者大会 ——LlamaCon。 在此次大会上,Meta 推出了一款面向消费者的 AI 聊天机器人应用程序,并发布了一个开发者 API,允许用户在云端访问 Llama 模型。 这些新产品旨在扩大 Meta 开源 Llama AI 模型的采用率,但实际上,Meta 的真正动机可能是超越 OpenAI。
4/30/2025 11:00:50 AM
AI在线
加速追赶!腾讯拆分AI团队,豪掷研发资源
据央广网消息,4月29日,公司对其混元大模型研发体系进行全面重构,聚焦算力、算法和数据三大核心,调整团队部署并加大研发投入。 此次调整的核心是成立两个新的部门:大语言模型部和多模态模型部,分别负责探索前沿技术、迭代基础模型。 同时,腾讯加强了底层支撑,设立数据平台部和机器学习平台部,专注于数据管理和AI平台建设,为混元大模型的研发提供全面支持。
4/30/2025 11:00:50 AM
AI在线
Meta 发布 Llama API,开发者可体验最新 AI 模型
在刚刚结束的首届 LlamaCon AI 开发者大会上,Meta 公司正式发布了其 Llama 系列 AI 模型的 API,名为 Llama API。 该 API 目前处于有限预览阶段,旨在让开发者能够探索和试验基于不同 Llama 模型的产品。 Meta 表示,这一新工具将与公司的 SDK 配合使用,允许开发者创建由 Llama 模型驱动的服务、工具和应用程序。
4/30/2025 11:00:50 AM
AI在线
Qwen3来了!新一代高性能与混合推理能力兼备的大语言模型!
阿里云正式发布通义千问Qwen3系列大模型,这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。 作为国产大模型的领军者,Qwen3不仅以2350亿参数的MoE架构刷新性能记录,更通过创新的"混合思考模式"和360万亿token的超大规模训练,成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本,涵盖MoE混合专家模型和Dense稠密模型。
4/30/2025 10:59:04 AM
Meta Llama AI模型下载量突破12亿,开发者热情高涨
在人工智能领域,Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。 这个数字在不久前的3月中旬刚刚达到10亿次,显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。 在首届 LlamaCon 开发者大会上,Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。
4/30/2025 10:00:55 AM
AI在线
OpenAI 紧急回滚 GPT-4o 旧版本,修复献媚问题
近日,OpenAI 针对其最新推出的 GPT-4o 模型所引发的 “献媚” 问题进行了紧急修复。 公司首席执行官兼联合创始人 Sam Altman 于今天凌晨宣布,免费用户已经完成了系统更新,100% 回滚至老版本,而付费用户的更新预计将在今天晚些时候完成。 用户反馈与问题曝光 自从 GPT-4o 发布以来,许多用户反映该模型在与其互动时表现出明显的阿谀奉承特质。
4/30/2025 10:00:51 AM
AI在线
万兴科技与华为云携手推进 AI 大模型技术创新
近日,万兴科技集团股份有限公司(以下简称 “万兴科技”)与华为云计算技术有限公司(以下简称 “华为云”)在深圳签署了战略合作协议。 此次合作旨在结合双方的优势,共同推动 AI 大模型的技术和应用创新,进一步开拓数字创意领域的潜力。 根据协议,万兴科技将充分发挥其在音视频大模型和 AI 应用方面的专业能力,而华为云则将利用其强大的云基础设施和市场拓展优势,建立深度合作关系。
4/30/2025 10:00:50 AM
AI在线
DeepSeek定制训练:微调与推理技术应用
一. 前言介绍本文内容:模型加载与预处理:详细讲解如何加载预训练模型、分词器,并处理输入数据集。 LoRA配置:介绍如何使用LoRA技术配置模型,并高效进行微调,节省计算资源。
4/30/2025 9:19:32 AM
AI知识库的真相,你知道吗?
很多人对AI知识库的想象是这样的,他们以为只需将所有资料一股脑地拖进AI客户端,比如 Cherry Studio 内。 图片这样,AI就会认真阅读所有内容,并自动生成完美结论。 然而,实际体验后,许多人发现AI知识库的效果远没有想象中理想,经常遇到各种奇怪的问题。
4/30/2025 9:06:23 AM
程序员NEO