文章列表
AI算法 | 如何训练自己的大模型?
1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。
4/1/2025 9:54:09 AM
Goldma
打工人自救指南:Manus+DeepSeek+Coze破局AI淘汰
前言2025年的中国AI竞技场中,三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务;Manus让小微企业人力成本直降70%(简历筛选、财务核算等);Coze的智能体孵化出了新兴职业(智能体架构师、智能体调教师等)。 当人们还在争论AI是否替代人类时,这三个现象级工具已悄然定义了智能技术的三种进化路径:认知突破、执行闭环与生态革命。 这场技术革命的核心分野,在于三者对人类能力的增强坐标差异:• DeepSeek强化认知维度:用强化学习与模型蒸馏技术,将专业决策的颗粒度细化至人类难以企及的层级(如投资策略模拟准确率达97.3%);• Manus重构执行范式:通过规划-执行-验证(PEV)架构,替代HR筛选、财务核算等流程性工作,实现企业人力成本大幅度降低;• Coze激活创新生态:其插件市场增长率达200%,催生“智能体调教师”“智能体架构师”等新职业,让技术民主化从口号变为现实。
4/1/2025 9:49:06 AM
后端小肥肠
OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户
OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元
刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1
虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用过程中,网友们逐渐发现,这个模型真的强到发指。 在门萨Norway的IQ测试中,它已经突破了130。
4/1/2025 9:17:00 AM
新智元
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”
一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/1/2025 8:45:15 AM
因流量压力,OpenAI 暂时禁用 Sora 新用户的视频生成功能
OpenAI因高流量压力暂时禁用Sora新用户的视频生成功能,现有用户仍可使用图像生成功能。CEO萨姆・奥尔特曼表示团队正加班维持服务。#OpenAI##Sora#
4/1/2025 7:58:42 AM
远洋
ChatGPT 新图像生成器可轻松生成逼真的假收据,OpenAI 回应
ChatGPT 4o的图像生成器被用于生成假餐厅收据,甚至添加污渍以增强真实性。虽然OpenAI表示图像包含元数据标记,但技术仍可能被滥用。#AI安全# #ChatGPT#
4/1/2025 7:38:45 AM
远洋
OpenAI 宣布完成 400 亿美元超大规模融资,估值达 3000 亿美元
OpenAI宣布完成400亿美元私募融资,估值达3000亿美元,由软银集团领投。新资金将用于推动AI研究、扩展计算基础设施及提升ChatGPT工具。部分资金将用于“星门”AI数据中心网络项目。#OpenAI融资# #人工智能#
4/1/2025 7:21:42 AM
远洋
OpenAI 官宣将发布自 GPT-2 以来的首个开放权重语言模型,并具有推理功能
到目前为止,用户只能通过 OpenAI 的界面或将其 API 密钥集成到他们的应用中来使用其模型,这意味着模型本身保持秘密和专有。
4/1/2025 7:06:52 AM
汪淼
DeepSeek能否超越ChatGPT?营销人员应该关注什么
在关于创业的商业课程中,初创企业进入市场时面临一个战略决策,即要与竞争对手保持同步。 对于一项新产品,你必须快速推向市场,或者为市场带来与众不同的东西。 如今,AI初创企业面临着比大多数初创企业更短的跑道来做出这一选择,因为当前领导者之间的竞争依然激烈——包括Perplexity、Claude、谷歌的Gemini和OpenAI的ChatGPT。
4/1/2025 7:00:00 AM
Pierre DeBois
C#玩转AIGC:手搓一个ChatGPT级代码补全插件,VS2025插件开发实录
在AIGC(人工智能生成内容)蓬勃发展的当下,开发者们不断探索其在软件开发流程中的创新应用。 其中,代码补全功能借助AIGC技术,能够显著提升编程效率。 本文将详细记录如何使用C#开发一个类似ChatGPT级别的代码补全插件,并将其集成到VS2025中,同时附上开源项目地址及性能测试报告。
4/1/2025 2:00:00 AM
替你完成80%的工作!深度测评GPT-4o制作IP设计全流程
了解到刚更新的 Chatgpt 4o 的强大后,我拿自己常画的头像 IP 做个测试,尝试跑通一整套从设定到落地的 IP 设计流程,以下是我的体验记录与阶段性总结。 更多案例:. 用嘴P图的时代到了!
4/1/2025 1:33:08 AM
插画师小光sir
行业沸腾!GPT-4o动动嘴秒出设计作品!Adobe真的顶得住?
这两天大家都被 OpenAI 的 GPT-4o 刷屏了吧。 这款更新后的多模态 AI 模型,直接把“开口就出图”变成了现实。 你只需要动动嘴皮子,说出想法,专业级别的设计作品就能跃然屏幕。
4/1/2025 12:33:10 AM
彭彭
C#开发者集体破防:ChatGPT写的代码居然比我好?实战对比!
在软件开发的江湖中,C#开发者们一直凭借着扎实的编程功底和丰富的项目经验,在代码的世界里纵横驰骋。 然而,ChatGPT的横空出世,如同一颗巨石投入平静的湖面,激起了千层浪。 越来越多的C#开发者开始怀疑,这个人工智能生成的代码,是否真的能超越自己?
4/1/2025 12:00:25 AM
conan
一站式解决Deepseek微调三大痛点:数据集、GPU资源、微调手册与源码
1.Deepseek微调痛点Deepseek模型微调是提升在行业领域表现的关键,但你是否被这些问题卡住? 数据集:不知道如何准备,担心数据泄露? GPU算力:算力不足,Deepseek不同模型尺寸对应的GPU配置选择一头雾水?
3/31/2025 5:10:00 PM
九章云极DataCanvas
ChatGPT图像生成功能上线,免费用户迎来创作新机遇
在科技快速发展的时代,人工智能(AI)正以惊人的速度渗透到我们生活的方方面面。 近期,ChatGPT 迎来了一项备受期待的新功能 ——AI 图像生成。 这一功能不仅满足了广大用户的创意需求,还以其独特的 “吉卜力风格” 受到热烈欢迎。
3/31/2025 4:21:00 PM
AI在线
万字长文总结:DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live
作者丨朱可轩编辑丨陈彩娴DeepSeek 在进一步点燃 AI Infra 可能性的同时,也带来了新的竞争格局,在 DeepSeek 的范式上,其他厂商能否追赶甚至实现超越尤为关键,这决定了他们能否继续留在牌桌上,当前,AI Infra 已然进入新的洗牌期。 圆桌主持人为 3C AGI Partners 创始人兼 CEO 王康曼,她一直专注于投资 AI Infra 赛道,其创立基金成立后仅一年多就已经成为英伟达全球 VC 联盟成员,也投资了海外发展势头最猛的两家 AI 芯片创业公司 Cerebras Systems 和 Groq。 同时,圆桌还邀请了魔形智能创始人CEO徐凌杰、探微芯联 CEO 刘学和清程极智联合创始人师天麾共同开启了一场深度对话。
3/31/2025 3:50:00 PM
朱可轩
文小言上新了!支持多模型调度,升级全新语音大模型、图片问答能力
3月31日,新一期百度AI DAY上,文小言宣布完成品牌焕新与功能升级。 除品牌视觉形象焕新外,文小言聚焦模型开放与功能创新,支持多模型融合调度,升级全新语音大模型、图片问答、AI生图生视频等多项能力,为用户带来更智能、更高效的AI体验。 百度AI产品创新业务负责人薛苏强调:“AI的未来不再是单纯的技术参数比拼,而是如何通过多模型协同,真正为用户创造价值。
3/31/2025 3:22:01 PM