AIGC宇宙 AIGC宇宙

理论

移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地

近日,国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势,迅速风靡全球。 移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。 目前,该模型正在多款智能终端上进行深入测试与优化。
2/14/2025 10:00:00 AM

手机大厂“敲定”AI伙伴:苹果选阿里,三星选智谱,DeepSeek为何被冷落?

在AI手机的浪潮中,市场传出苹果和三星纷纷选择了自己的合作伙伴,其中苹果将牵手阿里,三星拥抱了智谱,而当下备受瞩目的DeepSeek却意外落选。 分析认为,苹果在选择AI合作伙伴时,不仅看重技术实力,更看重合作伙伴的“实战经验”。 DeepSeek虽然在技术上有着亮眼的表现,但其团队规模较小,缺乏服务像苹果这样大型客户的经验。
2/14/2025 9:50:00 AM
舒云

JDK1.8也可以对接DeepSeek-R1,你知道吗?

什么是ai4j首先,我们先了解一下什么是ai4jAI4J 是一款 Java SDK,用于快速接入 AI 大模型应用。 它能整合多平台大模型,如 OpenAI、Ollama、智谱 Zhipu(ChatGLM)、深度求索 DeepSeek、月之暗面 Moonshot(Kimi)、腾讯混元 Hunyuan、零一万物(01)等,为用户提供快速整合 AI 的能力。 其特点包括提供统一的输入输出(对齐 OpenAI)以消除差异化,优化函数调用(Tool Call)和 RAG 调用,支持向量数据库(如 Pinecone),并且支持 JDK1.8,能满足很多仍在使用 JDK8 版本的应用需求。
2/14/2025 9:21:04 AM
了不起

DeepSeek很火,我来泼点冷水

从24年12月DeepSeek出圈以来,DeepSeek风潮越刮越勇,已有席卷全球之势。 各个大厂纷纷宣布自家接入DeepSeek,甚至有机顶盒企业也宣布自家产品接入了,市场情绪一度高涨。 在自媒体上,以DeepSeek为噱头卖课的,教人如何使用DeepSeek提示词的,或者利用DeepSeek 其他AI工具做自媒体赚快钱的,各种案例不胜枚举。
2/14/2025 9:17:16 AM
写文章的老张

仅需3步,稳定快速!火山引擎边缘大模型网关全面支持DeepSeek系列模型

DeepSeek 作为大模型新锐,凭借其在算法、架构及系统等核心领域的创新突破,迅速获得业界瞩目。 在巨大的热度下,面对海量请求,越来越多用户遇到了请求失败、调用超时、结果无法返回等稳定性问题。 火山引擎边缘大模型网关通过一个 API 接入多家模型服务,利用全球边缘节点就近调用,提升响应速度;支持故障自动切换、重试和超时控制,确保服务可靠性;兼容 OpenAI 接口标准,可快速集成 DeepSeek 等模型,降低接入成本。
2/14/2025 9:00:00 AM
边缘云技术团队

提示工程(prompt engineering)大揭秘

前言今天分享的是提示工程(prompt engineering),我们大概可以将其理解为用简单明了的话告诉AI你需要什么,比如先讲清任务,再加例子或背景,这样AI才能更懂你,给出更准更有用的回答! 2025年注定不平凡,大模型百花争放,闭源的守着自己的一亩三分地不断深耕,开源的出来就是王炸,开源大模型以DeepSeek为首的尤其突出,随后OpenAI,百度文心一言等相继传出部分大模型免费开放给用户使用。 普通老百姓现在能做的就是学会如何同人工智能交流,并得到你要的结果。
2/14/2025 8:44:39 AM
独行者木子李

神了!最大化 DeepSeek 潜能 :知识图谱激活

deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;画外音:文末有大彩蛋。 今天和大家聊聊,deepseek的核心技术之一的知识图谱激活。 什么是知识图谱(Knowledge Graph)?
2/14/2025 8:00:00 AM
58沈剑

向DeepSeek学习深度思考-十大思维链模式和案例分析

在这个复杂性与不确定性交织的时代,我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。 当常规的直觉反应和零散的思考难以应对精密问题时,结构化思维链就像一柄思维解剖刀——它帮助我们在乱麻中梳理出清晰的脉络,在混沌中发现隐藏的逻辑路径。 在我上一篇文章已经谈到,学习DeepSeek深度思考中CoT思维链的内容往往比最终的问题答案更加重要。
2/14/2025 5:00:00 AM
何明璐

一文带你看懂开源大模型基石LLaMA核心技术点,DeepSeek/千问等LLM的模型结构基础

LLaMA是目前很多SOTA开源大模型的基础,包括DeepSeek、千问等在内的很多大模型的模型机构大体上都沿用了LLaMA。 因此,LLaMA在模型结构的设计上可以说是目前大模型的一种最佳实践。 这篇文章就给大家汇总一下LLaMA的核心模型结构。
2/14/2025 1:00:00 AM
Fareise

DeepSeek爆火:普通人跨越AI提效终局的10倍进化指南

一、现象级事件:为什么DeepSeek能踏平AI提效的最后一公里? 在过去的十年,AI工具为人类工作效率带来了显著的提升,然而普通用户在使用这些工具时,仍然面临许多挑战,尤其是与提示词工程(Prompt Engineering)高度相关的问题。 ChatGPT这样的生成式AI工具对提示词工程的高度依赖。
2/14/2025 12:00:15 AM
AI小智

手把手教你找免费AI服务:搜公开的DeepSeek模型接口

网上很多教程教你怎么自己搭 AI 模型,但今天我要教大家一个野路子——用搜索引擎直接找别人已经搭好的 AI(Ollama)服务(前提是合法使用)。 就像有人忘记关 Wi-Fi,我教你怎么发现这些"公共资源"。 一、用 Fofa 找公开的 AI 服务Fofa 是什么?
2/14/2025 12:00:00 AM
wayn

阿里AI立大功!​一义乌商家靠AI拿下2000万美金大单!曝阿里国际站已接入DeepSeek等先进模型

出品 | 51CTO技术栈(微信号:blog51cto)“2000万美金的订单拿下了! 2025年开门红! ”近期一位义乌商家靠阿里国际站AI生意助手接下2000万美金中东大单的消息在外贸圈沸腾了。
2/13/2025 4:49:22 PM

DeepSeek 系列模型详解之——DeepSeek LLM

DeepSeek LLM发布于2024年1月,收集了2万亿个词元用于预训练,在模型层面沿用了LLaMA的架构,并将余弦退火学习率调度器替换为多阶段学习率调度器,便于持续训练。 并从多种来源收集了超过100万个实例进行监督微调(SFT)。 此外,利用直接偏好优化(DPO)技术进一步提升模型的对话能力。
2/13/2025 11:00:30 AM
小喵学AI

OpenAI深夜更新GPT-5路线图,奥特曼高密度爆料全模型免费计划。GPT-5真的要来了吗?我怀疑

编辑 | 言征GPT-5真的要来了! 最晚几个月! 最快一周内!
2/13/2025 10:52:56 AM
言征

美国拒签“巴黎声明”,撕开全球AI竞赛三大裂痕

2月11日,法国巴黎人工智能行动峰会落下帷幕,61国签署的《关于发展包容、可持续的人工智能造福人类与地球的声明》(下称《巴黎声明》),美英两国却选择了拒签和“退群”。 这场看似寻常的国际峰会,撕开了全球AI竞赛的三重裂痕:技术路线之争、治理权博弈与安全观对撞。 一、美式AI霸权:为何拒绝“可持续”紧箍咒?
2/13/2025 10:25:36 AM
佚名

哪些国家封杀了DeepSeek?

在人工智能领域的又一轮"狼来了"预警中,各国政府再次上演了一出集体焦虑的好戏。 这次的主角是人工智能公司 DeepSeek,而各国的反应仿佛看到了什么洪水猛兽。 在这场看似声势浩大的"防范"行动中,各国似乎都在用同一个模板复制粘贴着相似的说辞——"安全风险"、"数据担忧",仿佛这些词汇成了一个万能的理由。
2/13/2025 10:19:24 AM
佚名

DeepSeek 私有部署最强指南:满血推理,异构多机分布式,国产显卡无缝支持!

还还在为DeepSeek模型部署的各种难题抓狂? 各种教程的下载分片、合并模型、编译环境……这些繁琐的操作是不是让你头大? DeepSeek R1 火了,私有部署需求暴增,教程满天飞,但实际操作起来却麻烦得要命!
2/13/2025 10:12:27 AM
AI寒武纪

没有数据、没有GPU的情况下怎么训练DeepSeek

春节期间,AI 界热闹非凡,到处都是关于 DeepSeek 的报道。 大家都知道,训练好的模型通常需要昂贵的专用 GPU,这对很多想试试微调技术的人来说,真是一道门槛。 好消息来了:你完全可以用免费的 Google Colab Notebook 来实现微调。
2/13/2025 9:45:31 AM
MobotStone