理论
移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地
近日,国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势,迅速风靡全球。 移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。 目前,该模型正在多款智能终端上进行深入测试与优化。
2/14/2025 10:00:00 AM
手机大厂“敲定”AI伙伴:苹果选阿里,三星选智谱,DeepSeek为何被冷落?
在AI手机的浪潮中,市场传出苹果和三星纷纷选择了自己的合作伙伴,其中苹果将牵手阿里,三星拥抱了智谱,而当下备受瞩目的DeepSeek却意外落选。 分析认为,苹果在选择AI合作伙伴时,不仅看重技术实力,更看重合作伙伴的“实战经验”。 DeepSeek虽然在技术上有着亮眼的表现,但其团队规模较小,缺乏服务像苹果这样大型客户的经验。
2/14/2025 9:50:00 AM
舒云
JDK1.8也可以对接DeepSeek-R1,你知道吗?
什么是ai4j首先,我们先了解一下什么是ai4jAI4J 是一款 Java SDK,用于快速接入 AI 大模型应用。 它能整合多平台大模型,如 OpenAI、Ollama、智谱 Zhipu(ChatGLM)、深度求索 DeepSeek、月之暗面 Moonshot(Kimi)、腾讯混元 Hunyuan、零一万物(01)等,为用户提供快速整合 AI 的能力。 其特点包括提供统一的输入输出(对齐 OpenAI)以消除差异化,优化函数调用(Tool Call)和 RAG 调用,支持向量数据库(如 Pinecone),并且支持 JDK1.8,能满足很多仍在使用 JDK8 版本的应用需求。
2/14/2025 9:21:04 AM
了不起
DeepSeek很火,我来泼点冷水
从24年12月DeepSeek出圈以来,DeepSeek风潮越刮越勇,已有席卷全球之势。 各个大厂纷纷宣布自家接入DeepSeek,甚至有机顶盒企业也宣布自家产品接入了,市场情绪一度高涨。 在自媒体上,以DeepSeek为噱头卖课的,教人如何使用DeepSeek提示词的,或者利用DeepSeek 其他AI工具做自媒体赚快钱的,各种案例不胜枚举。
2/14/2025 9:17:16 AM
写文章的老张
仅需3步,稳定快速!火山引擎边缘大模型网关全面支持DeepSeek系列模型
DeepSeek 作为大模型新锐,凭借其在算法、架构及系统等核心领域的创新突破,迅速获得业界瞩目。 在巨大的热度下,面对海量请求,越来越多用户遇到了请求失败、调用超时、结果无法返回等稳定性问题。 火山引擎边缘大模型网关通过一个 API 接入多家模型服务,利用全球边缘节点就近调用,提升响应速度;支持故障自动切换、重试和超时控制,确保服务可靠性;兼容 OpenAI 接口标准,可快速集成 DeepSeek 等模型,降低接入成本。
2/14/2025 9:00:00 AM
边缘云技术团队
提示工程(prompt engineering)大揭秘
前言今天分享的是提示工程(prompt engineering),我们大概可以将其理解为用简单明了的话告诉AI你需要什么,比如先讲清任务,再加例子或背景,这样AI才能更懂你,给出更准更有用的回答! 2025年注定不平凡,大模型百花争放,闭源的守着自己的一亩三分地不断深耕,开源的出来就是王炸,开源大模型以DeepSeek为首的尤其突出,随后OpenAI,百度文心一言等相继传出部分大模型免费开放给用户使用。 普通老百姓现在能做的就是学会如何同人工智能交流,并得到你要的结果。
2/14/2025 8:44:39 AM
独行者木子李
神了!最大化 DeepSeek 潜能 :知识图谱激活
deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;画外音:文末有大彩蛋。 今天和大家聊聊,deepseek的核心技术之一的知识图谱激活。 什么是知识图谱(Knowledge Graph)?
2/14/2025 8:00:00 AM
58沈剑
向DeepSeek学习深度思考-十大思维链模式和案例分析
在这个复杂性与不确定性交织的时代,我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。 当常规的直觉反应和零散的思考难以应对精密问题时,结构化思维链就像一柄思维解剖刀——它帮助我们在乱麻中梳理出清晰的脉络,在混沌中发现隐藏的逻辑路径。 在我上一篇文章已经谈到,学习DeepSeek深度思考中CoT思维链的内容往往比最终的问题答案更加重要。
2/14/2025 5:00:00 AM
何明璐
一文带你看懂开源大模型基石LLaMA核心技术点,DeepSeek/千问等LLM的模型结构基础
LLaMA是目前很多SOTA开源大模型的基础,包括DeepSeek、千问等在内的很多大模型的模型机构大体上都沿用了LLaMA。 因此,LLaMA在模型结构的设计上可以说是目前大模型的一种最佳实践。 这篇文章就给大家汇总一下LLaMA的核心模型结构。
2/14/2025 1:00:00 AM
Fareise
DeepSeek爆火:普通人跨越AI提效终局的10倍进化指南
一、现象级事件:为什么DeepSeek能踏平AI提效的最后一公里? 在过去的十年,AI工具为人类工作效率带来了显著的提升,然而普通用户在使用这些工具时,仍然面临许多挑战,尤其是与提示词工程(Prompt Engineering)高度相关的问题。 ChatGPT这样的生成式AI工具对提示词工程的高度依赖。
2/14/2025 12:00:15 AM
AI小智
手把手教你找免费AI服务:搜公开的DeepSeek模型接口
网上很多教程教你怎么自己搭 AI 模型,但今天我要教大家一个野路子——用搜索引擎直接找别人已经搭好的 AI(Ollama)服务(前提是合法使用)。 就像有人忘记关 Wi-Fi,我教你怎么发现这些"公共资源"。 一、用 Fofa 找公开的 AI 服务Fofa 是什么?
2/14/2025 12:00:00 AM
wayn
阿里AI立大功!一义乌商家靠AI拿下2000万美金大单!曝阿里国际站已接入DeepSeek等先进模型
出品 | 51CTO技术栈(微信号:blog51cto)“2000万美金的订单拿下了! 2025年开门红! ”近期一位义乌商家靠阿里国际站AI生意助手接下2000万美金中东大单的消息在外贸圈沸腾了。
2/13/2025 4:49:22 PM
DeepSeek 系列模型详解之——DeepSeek LLM
DeepSeek LLM发布于2024年1月,收集了2万亿个词元用于预训练,在模型层面沿用了LLaMA的架构,并将余弦退火学习率调度器替换为多阶段学习率调度器,便于持续训练。 并从多种来源收集了超过100万个实例进行监督微调(SFT)。 此外,利用直接偏好优化(DPO)技术进一步提升模型的对话能力。
2/13/2025 11:00:30 AM
小喵学AI
OpenAI深夜更新GPT-5路线图,奥特曼高密度爆料全模型免费计划。GPT-5真的要来了吗?我怀疑
编辑 | 言征GPT-5真的要来了! 最晚几个月! 最快一周内!
2/13/2025 10:52:56 AM
言征
美国拒签“巴黎声明”,撕开全球AI竞赛三大裂痕
2月11日,法国巴黎人工智能行动峰会落下帷幕,61国签署的《关于发展包容、可持续的人工智能造福人类与地球的声明》(下称《巴黎声明》),美英两国却选择了拒签和“退群”。 这场看似寻常的国际峰会,撕开了全球AI竞赛的三重裂痕:技术路线之争、治理权博弈与安全观对撞。 一、美式AI霸权:为何拒绝“可持续”紧箍咒?
2/13/2025 10:25:36 AM
佚名
哪些国家封杀了DeepSeek?
在人工智能领域的又一轮"狼来了"预警中,各国政府再次上演了一出集体焦虑的好戏。 这次的主角是人工智能公司 DeepSeek,而各国的反应仿佛看到了什么洪水猛兽。 在这场看似声势浩大的"防范"行动中,各国似乎都在用同一个模板复制粘贴着相似的说辞——"安全风险"、"数据担忧",仿佛这些词汇成了一个万能的理由。
2/13/2025 10:19:24 AM
佚名
DeepSeek 私有部署最强指南:满血推理,异构多机分布式,国产显卡无缝支持!
还还在为DeepSeek模型部署的各种难题抓狂? 各种教程的下载分片、合并模型、编译环境……这些繁琐的操作是不是让你头大? DeepSeek R1 火了,私有部署需求暴增,教程满天飞,但实际操作起来却麻烦得要命!
2/13/2025 10:12:27 AM
AI寒武纪
没有数据、没有GPU的情况下怎么训练DeepSeek
春节期间,AI 界热闹非凡,到处都是关于 DeepSeek 的报道。 大家都知道,训练好的模型通常需要昂贵的专用 GPU,这对很多想试试微调技术的人来说,真是一道门槛。 好消息来了:你完全可以用免费的 Google Colab Notebook 来实现微调。
2/13/2025 9:45:31 AM
MobotStone
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用