DeepSeek
Qwen和DeepSeek为何都选YaRN?
这篇文章,我们还是从面试官的视角出发,一起来分析一下,如果你在面试现场被问到这个题目,应该如何回答? 1.面试官心理分析首先还是分析一下面试官的心理,面试官问这个问题,主要是想考察三点:第一,你知不知道长度外推这个概念? 很多同学可能听都没听过这个概念,那这个问题当然也就无从答起了。
6/6/2025 1:26:00 AM
丁师兄
互联网女皇最新报告:全球 AI 竞争格局生变 中国与开源AI全面突围
硅谷投资人Mary Meeker最新发布的AI报告揭示:全球AI竞争格局正经历深刻重塑。 中国力量与开源浪潮正在撼动OpenAI等头部公司主导的生态,全球进入“群雄逐鹿”的新阶段。 中国AI:性能逼近国际一线,产业融合爆发报告指出,中国在大型语言模型发布节奏上正快速逼近美国,DeepSeek、阿里Qwen、百度文心一言等模型在代码生成与数学推理等核心任务中表现优异。
6/5/2025 3:00:56 PM
AI在线
DeepSeek可能使用了Google Gemini数据训练新 AI 模型
近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。 然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。 墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。
6/4/2025 10:01:25 AM
AI在线
DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路
大家好,我是肆〇柒,在AI圈,大型语言模型(LLM)的训练对高质量、多样化数据的需求日益增长。 从去年到现在,一些模型在发布的时候,会有论文或者技术报告,里面多多少少都会提及合成数据,并且在多数情况下,合成数据的效果并不差。 比如,我所看到的报告中,使用了合成数据的模型如下盘点(应该会有遗漏,它并不完整)。
6/4/2025 9:15:16 AM
肆零柒
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM
推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源
DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM
我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型
我国水利标准AI大模型正式发布,采用海量知识库+DeepSeek/Qwen双模型,实现水利标准全生命周期数字化、智能化管理。查重比对准确率超96.7%,标准编制效率提高2.5倍。#水利科技##AI大模型#
6/3/2025 10:04:47 AM
远洋
百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强
今日,百度AI搜索宣布全面接入深度思考模型DeepSeek R1-0528 ,用户可通过PC端、APP端免费使用。
5/31/2025 3:08:07 PM
问舟
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
他表示,DeepSeek 和阿里巴巴的通义千问(Qwen)是“当前表现最优的开源 AI 模型之一”,已在美国、欧洲等多个市场获得广泛应用。
5/30/2025 9:07:30 PM
清源
百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型
百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。 这一重要更新于5月29日上线,旨在为企业和用户提供更强大的 AI 能力和支持。 千帆模型开发平台不仅上架了这一全新大模型,还同步推出了一系列实用功能,包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。
5/30/2025 9:05:04 AM
AI在线
DeepSeek免费超越GPT-4?
DeepSeek 最新发布了 R1-0528 版本,这次更新的最大亮点是"深度思考"能力大幅提升。 很简单:进入 DeepSeek 官网、APP 或小程序,在对话界面开启"深度思考"功能即可。 图片API 接口也同步更新,调用方式保持不变。
5/30/2025 7:40:56 AM
程序员NEO
DeepSeek-R1小升级!体验后有被惊艳到
今年1月,DeepSeek-R1横空出世,凭借在性能和成本方面展现出的巨大优势,迅速成为全球人工智能(AI)领域瞩目的焦点。 时隔四个月,这款大模型迎来了小升级。 5月28日,DeepSeek正式发布了R1的最新版本——DeepSeek-R1-0528。
5/30/2025 6:57:53 AM
Yu
万人在看,用Deepseek根据需求定制化写文档并导出,你一定用的上!
需求分析前几天工程立项,主要批量写功能点用于新一年的工程预算。 但是工作量大,共计20000 行左右,要求3天之内完成。 图片文档主要结构及表头信息如下(提供模版部分字段)图片由于工作量太大,手工敲需要消耗大量的人力,于是借助deepseek大模型实现,让AI帮忙干活。
5/30/2025 2:10:00 AM
微微一笑
“一天内完成更新”:腾讯多款产品接入 DeepSeek R1-0528 最新版
腾讯官方今日发文宣布,腾讯元宝、ima、搜狗输入法、QQ 浏览器等产品迎来升级,率先接入深度思考模型 DeepSeek R1-0528 最新版,多项能力全面提升。具体如下:
· 推理能力大幅提升,代码水平更强
· 写作表现更有人味,格式更规范
· 思考不仅快,还有条理、讲逻辑,同时支持长时间思考
5/29/2025 11:13:14 PM
归泷
百度智能云千帆大模型平台、文小言宣布接入 DeepSeek-R1-0528 最新模型
百度智能云千帆大模型平台和文小言App宣布全面接入DeepSeek-R1-0528最新模型,该模型在复杂逻辑推理、长文本处理稳定性、代码生成质量等方面有显著提升。企业用户和开发者可通过千帆平台体验新模型,并利用全流程工具链构建专属大模型。文小言App用户也可体验最新的AI问答和创作能力。#百度智能云##DeepSeek#
5/29/2025 10:09:54 PM
远洋
全面解读:新版R1低调升级!编程强到起飞直追o3-high,支持30分钟以上长思考,推理、写作都进化了!
出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”! 图片这波有多低调呢? DeepSeek 又是“0 宣发”出手,连一句英文公告都没有。
5/29/2025 1:05:32 PM
伊风
DeepSeek R1-0528震撼发布:免费128K上下文,性能直逼OpenAI o3!
作为AI领域的先锋力量,DeepSeek再次以其技术突破引发行业热议。 2025年5月28日,DeepSeek悄然发布了R1-0528版本,这一更新不仅在性能上实现大幅跃升,还以免费开放的姿态震撼市场。 本文由AIbase编辑部整理最新信息,带您深入了解这一版本的亮点与潜力。
5/29/2025 10:01:27 AM
AI在线
DeepSeek悄然发布R1最新版本,性能直逼OpenAI o3引发业界震动
开源大模型领域再次迎来重磅消息。 DeepSeek平台近日低调发布了R1模型的最新0528版本,这一举动在AI开发者社区引起了广泛关注。 值得注意的是,DeepSeek此次采用了相当低调的发布策略,既没有发布详细的技术说明文档,也没有举行任何形式的发布活动,而是选择"悄悄"开放模型下载。
5/29/2025 10:01:21 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用