大模型

在 TKE 上部署 AI 大模型（以DeepSeek-R1为例）

概述本文介绍如何在 TKE 上部署 AI 大模型，以 DeepSeek-R1 为例。部署思路使用 Ollama 运行 AI 大模型，再通过 OpenWebUI 暴露一个聊天交互的界面，OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具，可以看成是大模型领域的 Docker，可以下载所需的大模型并暴露 API。

2/6/2025 10:18:45 AM

I am roc roc

DeepSeek 大模型引爆市场：概念股开盘集体涨停

2月5日，A股市场开盘后，DeepSeek 概念股集体爆发，每日互动、美格智能、天娱数科、航锦科技、南威软件等多只股票竞价涨停。此外，飞利信、万兴科技、昆仑万维、海光信息等个股也涨幅靠前。这一市场热潮的背后，是中国 AI 初创公司深度求索（DeepSeek）发布的两款大模型——DeepSeek-V3和 DeepSeek-R1。

2/5/2025 10:50:00 AM

AI在线

消息称阿里引入顶级人工智能科学家或将加码AI To C业务

近期，阿里巴巴在AI领域迎来了一位重量级人物。据业内人士透露，一位全球顶级人工智能科学家已于近期正式入职阿里巴巴，未来或将专注于AI To C业务的基础大模型研发与应用。这位科学家在工业界和学术界均拥有超过20年的经验，尤其在多模态AI领域成果丰硕，曾主导发表过上百篇大模型顶级论文。

2/4/2025 2:08:00 PM

AI在线

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

2025 年的春节无疑已被 DeepSeek 霸屏。过去三年每年的春节都有一次重磅的 AI 讨论：2023 年是 ChatGPT、2024 年是 Sora，这两股风潮都是由 OpenAI 掀起，而 2025 年则是 DeepSeek 的 V3 与 R1。除夕当天 1 月 28 日，DeepSeek 更是趁热发布了文生图模型 Janus-Pro，但后者没有 V3 与 R1 吸引的关注大，原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源：算力。

1/31/2025 8:57:00 PM

陈彩娴

ChatGPT回应DeepSeek超越:排名变化或为暂时现象

DeepSeek应用超越ChatGPT，登顶苹果美国区免费App下载排行榜，引发市场热议。这家被称为“大模型版拼多多”的中国公司，其应用的快速上升让海内外技术同行和投资机构都密切关注。对于这一排名变化，ChatGPT回应称，DeepSeek可能在某些方面有独特优势或满足了用户特定需求，但这样的排名变化也许是暂时的，同时也表明AI应用市场竞争激烈，创新空间巨大。

1/28/2025 10:45:00 AM

AI在线

DeepSeek称遭到大规模恶意攻击，注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击，导致注册过程可能变得繁忙。 DeepSeek提醒用户，如果遇到注册困难，可以稍等后重试。已注册用户可以正常登录，不受影响。

1/28/2025 10:37:00 AM

AI在线

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷

“DeepSeek或彻底改变游戏规则”！中国大模型“搅动”硅谷，巨头进入恐慌模式，外媒刷屏，大佬发声：中国AI已追上美国

1/27/2025 8:29:32 AM

deep

百川智能上线开源全模态模型 Omni-1.5，号称多项能力超越 GPT-4o mini

官方宣称，其在视觉、语音及多模态流式处理等方面，Baichuan-Omni-1.5 的表现均优于 GPT-4omini；在多模态医疗应用领域，其具备更突出的领先优势。

1/26/2025 3:32:39 PM

清源

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型的竞争似乎正在结束，只有少数几个明显的赢家。其中，DeepSeek V3 已成为 2024 年的焦点，引领中国开源模型的发展。据 Hugging Face 称，DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋，上个月的下载量为 45,499 次，与Meta 的 Llama 3.1（491,629 次下载）和谷歌的 Gemma 2（377,651 次下载）并驾齐驱。

1/26/2025 11:38:54 AM

言征

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）1月23日，在冬季达沃斯论坛的“辩论技术”环节，Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried（主持人）就未来十年前沿科技进行了时长47分钟的“全民”大讨论，话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索，也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示，现在的大模型并没有达到预期效果，在很多方面都存在不足：“我认为当前 LLM范式的保质期相当短，可能只有3到5年。

1/26/2025 11:35:05 AM

言征

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

近日，中国电信人工智能研究院（TeleAI）“复杂推理大模型” TeleAI-t1-preview 正式发布，即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。早在 1500 多年前，数学家祖冲之就曾在《辩戴法兴难新历》中指出，复杂事物的运行规律并非超自然现象，而是可以通过实际观测、数据推理而严谨求得。

1/26/2025 9:41:00 AM

新闻助手

中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

据介绍，TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

1/25/2025 5:57:55 PM

清源

字节启动AGI长期研究计划，代号Seed Edge

1月23日，据媒体报道，字节豆包大模型团队已在内部组建AGI长期研究团队，代号“Seed Edge”，鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。接近字节的知情人士透露，Seed Edge的目标是探索AGI的新方法，代号名中Seed是豆包大模型团队名称，Edge代表最前沿的AGI探索。 Seed Edge鼓励跨模态、跨团队合作，为项目成员提供宽松的研究环境，实行采用更长周期的考核方式，以保障挑战真正颠覆性的AGI课题。

1/23/2025 9:29:00 AM

新闻助手

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。 1月22日，网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型，子曰-o1支持在消费级显卡上进行部署，采用思维链技术，能够提供细致解题过程，以强逻辑和推理能力，实现更高的解题准确性，并提供中文逻辑推理。

1/22/2025 11:32:00 AM

新闻助手