理论

提示工程(prompt engineering)大揭秘

前言今天分享的是提示工程(prompt engineering)，我们大概可以将其理解为用简单明了的话告诉AI你需要什么，比如先讲清任务，再加例子或背景，这样AI才能更懂你，给出更准更有用的回答！ 2025年注定不平凡，大模型百花争放，闭源的守着自己的一亩三分地不断深耕，开源的出来就是王炸，开源大模型以DeepSeek为首的尤其突出，随后OpenAI，百度文心一言等相继传出部分大模型免费开放给用户使用。普通老百姓现在能做的就是学会如何同人工智能交流，并得到你要的结果。

2/14/2025 8:44:39 AM

独行者木子李

神了！最大化 DeepSeek 潜能：知识图谱激活

deepseek原理应用实践，和大家分享：小众的，deepseek核心技术原理；大众的，提示词要怎么写；画外音：文末有大彩蛋。今天和大家聊聊，deepseek的核心技术之一的知识图谱激活。什么是知识图谱（Knowledge Graph）？

2/14/2025 8:00:00 AM

58沈剑

向DeepSeek学习深度思考-十大思维链模式和案例分析

在这个复杂性与不确定性交织的时代，我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。当常规的直觉反应和零散的思考难以应对精密问题时，结构化思维链就像一柄思维解剖刀——它帮助我们在乱麻中梳理出清晰的脉络，在混沌中发现隐藏的逻辑路径。在我上一篇文章已经谈到，学习DeepSeek深度思考中CoT思维链的内容往往比最终的问题答案更加重要。

2/14/2025 5:00:00 AM

何明璐

一文带你看懂开源大模型基石LLaMA核心技术点，DeepSeek/千问等LLM的模型结构基础

LLaMA是目前很多SOTA开源大模型的基础，包括DeepSeek、千问等在内的很多大模型的模型机构大体上都沿用了LLaMA。因此，LLaMA在模型结构的设计上可以说是目前大模型的一种最佳实践。这篇文章就给大家汇总一下LLaMA的核心模型结构。

2/14/2025 1:00:00 AM

Fareise

DeepSeek爆火：普通人跨越AI提效终局的10倍进化指南

一、现象级事件：为什么DeepSeek能踏平AI提效的最后一公里？在过去的十年，AI工具为人类工作效率带来了显著的提升，然而普通用户在使用这些工具时，仍然面临许多挑战，尤其是与提示词工程（Prompt Engineering）高度相关的问题。 ChatGPT这样的生成式AI工具对提示词工程的高度依赖。

2/14/2025 12:00:15 AM

AI小智

手把手教你找免费AI服务：搜公开的DeepSeek模型接口

网上很多教程教你怎么自己搭 AI 模型，但今天我要教大家一个野路子——用搜索引擎直接找别人已经搭好的 AI（Ollama）服务（前提是合法使用）。就像有人忘记关 Wi-Fi，我教你怎么发现这些"公共资源"。一、用 Fofa 找公开的 AI 服务Fofa 是什么？

2/14/2025 12:00:00 AM

wayn

阿里AI立大功！一义乌商家靠AI拿下2000万美金大单！曝阿里国际站已接入DeepSeek等先进模型

出品 | 51CTO技术栈（微信号：blog51cto）“2000万美金的订单拿下了！ 2025年开门红！ ”近期一位义乌商家靠阿里国际站AI生意助手接下2000万美金中东大单的消息在外贸圈沸腾了。

2/13/2025 4:49:22 PM

DeepSeek 系列模型详解之——DeepSeek LLM

DeepSeek LLM发布于2024年1月，收集了2万亿个词元用于预训练，在模型层面沿用了LLaMA的架构，并将余弦退火学习率调度器替换为多阶段学习率调度器，便于持续训练。并从多种来源收集了超过100万个实例进行监督微调(SFT)。此外，利用直接偏好优化（DPO）技术进一步提升模型的对话能力。

2/13/2025 11:00:30 AM

小喵学AI

OpenAI深夜更新GPT-5路线图，奥特曼高密度爆料全模型免费计划。GPT-5真的要来了吗？我怀疑

编辑 | 言征GPT-5真的要来了！最晚几个月！最快一周内！

2/13/2025 10:52:56 AM

言征

美国拒签“巴黎声明”，撕开全球AI竞赛三大裂痕

2月11日，法国巴黎人工智能行动峰会落下帷幕，61国签署的《关于发展包容、可持续的人工智能造福人类与地球的声明》（下称《巴黎声明》），美英两国却选择了拒签和“退群”。这场看似寻常的国际峰会，撕开了全球AI竞赛的三重裂痕：技术路线之争、治理权博弈与安全观对撞。一、美式AI霸权：为何拒绝“可持续”紧箍咒？

2/13/2025 10:25:36 AM

佚名

哪些国家封杀了DeepSeek？

在人工智能领域的又一轮"狼来了"预警中，各国政府再次上演了一出集体焦虑的好戏。这次的主角是人工智能公司 DeepSeek，而各国的反应仿佛看到了什么洪水猛兽。在这场看似声势浩大的"防范"行动中，各国似乎都在用同一个模板复制粘贴着相似的说辞——"安全风险"、"数据担忧"，仿佛这些词汇成了一个万能的理由。

2/13/2025 10:19:24 AM

佚名

DeepSeek 私有部署最强指南：满血推理，异构多机分布式，国产显卡无缝支持！

还还在为DeepSeek模型部署的各种难题抓狂？各种教程的下载分片、合并模型、编译环境……这些繁琐的操作是不是让你头大？ DeepSeek R1 火了，私有部署需求暴增，教程满天飞，但实际操作起来却麻烦得要命！

2/13/2025 10:12:27 AM

AI寒武纪

没有数据、没有GPU的情况下怎么训练DeepSeek

春节期间，AI 界热闹非凡，到处都是关于 DeepSeek 的报道。大家都知道，训练好的模型通常需要昂贵的专用 GPU，这对很多想试试微调技术的人来说，真是一道门槛。好消息来了：你完全可以用免费的 Google Colab Notebook 来实现微调。

2/13/2025 9:45:31 AM

MobotStone

奥特曼再谈DeepSeek：每天醒来都有压力

关乎当红炸子鸡DeepSeek，奥特曼最新观点出炉：对DeepSeek的出现并不意外，而且类似的情况会越来越多。这就是奥特曼在最新一期《泰晤士报》科技播客节目中所提及的内容之一。并且在被问及是否担心OpenAI会成为AI界的Napster（首个P2P音乐共享平台，后因商业压力以失败告终）时，他表示：唯一不让这种事发生的方法就是每天都为此担心。

2/13/2025 9:30:00 AM

量子位

o3拿下IOI 2024金牌！新论文公布RL秘诀：AI自己设计测试时推理策略，无需人类干预

IOI 2024金牌，OpenAI o3轻松高分拿下！刚刚，OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告，论文中放出了OpenAI家推理模型三兄弟在IOI和CodeForce上的具体成绩。三兄弟分别是OpenAI o1、o1-ioi（以o1为基础微调等改进而来）、o3，三者成绩如下。

2/13/2025 9:20:00 AM

量子位

OpenAI放王炸！GPT-5免费无限使用，产品矩阵大整合！

今天凌晨3点，OpenAI首席执行官Sam Altman公布了GPT-4.5和GPT-5的炸裂消息。 Altman表示，OpenAI很快发布GPT-4.5，就是传说中的猎户座模型（Orion），也是最后一个非思维链模型。接着会整合GPT和O系列两大模型打造一个全新的系统，能自动选择思考和非思考功能，适用于多种任务。

2/13/2025 9:15:00 AM

AIGC开放社区

刚刚，奥特曼剧透GPT-4.5、GPT-5重大更新，o3取消独立发布

奥特曼深夜一则推文，在网络上掀起了讨论狂潮。没有一点点预告，奥特曼亲自公布自家产品路线图，并承认公司最近发布的一些产品有些混乱。推文透露，OpenAI 的下一步是发布 GPT-4.5，这是其最后一个非思维链 (CoT) 模型。

2/13/2025 9:10:47 AM

机器之心

DeepSeek-R1技术解码：如何实现大模型推理能力的提升？

1月20日，幻方量化旗下AI公司深度求索(DeepSeek)发布了新一代开源大模型DeepSeek-R1。作为一款专注于推理能力的AI大模型，DeepSeek-R1凭借着成本低、推理能力强等优势，在人工智能领域掀起了千层巨浪，引起了人们的广泛关注与讨论。 DeepSeek-R1的成功，让我们更加清晰地认识到推理能力在当下人工智能发展中的重要地位。

2/13/2025 8:51:23 AM

资讯热榜

苹果发布全新Xcode 26开发者工具：内置ChatGPT先进AI功能那个男人回来了！Ilya现身多伦多大学毕业典礼：AI 像是用数字方式复制出来的大脑！不管你愿不愿意，AI都将深刻影响你的一生！ DeepSeek前高管秘密创业，新AI Agent项目已获顶级VC押注支持MCP！开源智能体开发框架 Rowboat：打造你的智能助手只需几分钟 ChatGPT 语音功能升级，实时翻译对话更自然流畅长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试谷歌 Gemini 应用月下载量超越 ChatGPT，用户活跃度仍显不足苹果将 ChatGPT 和其他 AI 模型引入 Xcode

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画数据谷歌机器人大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码英伟达 Anthropic 芯片生成式开发者蛋白质腾讯神经网络研究 3D 生成训练苹果计算智能体 Sora 机器学习 AI设计 AI for Science Claude GPU AI视频人形机器人华为搜索场景百度大语言模型 xAI 预测伟达深度学习 Transformer 字节跳动 Agent 模态具身智能神器推荐 LLaMA 文本视觉 Copilot 算力工具 LLM 驾驶 API 大型语言模型应用 RAG 亚马逊

理论