API
在 TKE 上部署 AI 大模型(以DeepSeek-R1为例)
概述本文介绍如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 为例。 部署思路使用 Ollama 运行 AI 大模型,再通过 OpenWebUI 暴露一个聊天交互的界面,OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具,可以看成是大模型领域的 Docker,可以下载所需的大模型并暴露 API。
2/6/2025 10:18:45 AM
I am roc roc
AI创业踩坑!YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。 如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。 ”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。
2/3/2025 1:18:01 PM
伊风
硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务
2月1日,硅基流动和华为云团队为国内用户推出了基于华为云昇腾云服务的 DeepSeek-R1 和 DeepSeek-V3 大模型推理服务,并在 SiliconCloud 云平台首发上线。这两款模型具有五大特点:支持华为云昇腾云服务,联合创新推理加速,提供稳定的生产级服务,零部署门槛,且有优惠价格。
开发者可以通过 SiliconCloud API 轻松集成这些模型,体验加速效果并提高应用开发效率。平台支持多种大模型和应用,帮助开发者降低算力成本并实现更高效的生成式 AI 应用开发
2/1/2025 4:03:00 PM
新闻助手
OpenAI的停机事件教会我们要构建更具弹性的系统
译者 | 李睿审校 | 重楼2024年12月11日, OpenAI公司提供的服务由于新部署的遥测服务出现问题而遭遇重大停机。 此次事件影响了API、ChatGPT和Sora服务,导致持续数小时的服务中断。 作为一家致力于提供准确高效的人工智能解决方案的供应商,OpenAI公司为此发布一份详细的事后分析报告,公开地讨论了出现问题的原因,以及他们如何计划防止在未来发生类似事件。
12/27/2024 4:03:38 PM
李睿
集中接入:将大模型统一管理起来,你觉得怎么样?
为什么要集中接入? 集中接入,就是把大模型的接入统一到一个地方管理起来,下面这张图可以很好地帮我们理解集中接入:图片从这个图上,你已经看出来了,所谓的集中接入,其实就是构建了一个代理,我们后面就称它为大模型代理。 到这里,你可能产生这样的疑问:我直接用大模型不好吗?
12/27/2024 8:27:27 AM
greencoatman
OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA
10/2/2024 1:41:37 PM
故渊
OpenAI 发布“学院”计划:为开发者提供 100 万美元 API 信用额度及技术指导
OpenAI 今天宣布推出“OpenAI 学院”,旨在帮助开发者和组织利用 AI 解决难题,并推动社区经济增长。该平台将确保生成式 AI 的强大功能在全球范围内广泛普及,包括中低收入国家。OpenAI 表示,许多国家的科技行业发展迅速,拥有才华横溢的开发者和创新型组织,但仍然缺乏高级培训和技术资源的支持。通过投资于本地 AI 人才的发展,可以促进包括医疗、农业、教育和金融等行业的经济增长与创新。该项目将提供如下方面的支持:培训与技术指导:OpenAI 专家将为利用 AI 的开发者和使命驱动型组织提供支持。API 使
9/23/2024 11:38:16 PM
清源
OpenAI 宣布 10 月起举办第 2 届 DevDay 开发者大会:无新 AI 模型,聚焦 API 和开发工具
OpenAI 公司宣布将于 2024 年 10 月 1 日起,在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动,遗憾的是本次活动不会发布新的 AI 前沿模型。OpenAI 计划在旧金山、伦敦和新加坡分别举办活动,AI在线附上具体日程如下:旧金山:10 月 1 日伦敦:10 月 30 日新加坡:11 月 21 日OpenAI 公司于 2023 年 11 月举办了首届 DevDay 开发者大会,公布了具有 128K 上下文和更低价格的 GPT-4 Turbo、新的 Assistants API、GPT-4
8/6/2024 2:43:53 PM
故渊
OpenAI 断供中国大陆市场,零一万物 Yi API 二折平替 GPT-4o
6月25日,有多名开发者收到了来自 OpenAI 的公告,公告中显示,OpenAI 将于7月9日开始封锁来自非支持国家和地区的 API 流量。 在 OpenAI 给出的“支持访问国家和地区”名单上(),中国大陆、中国香港等地均未在列。 在审视 OpenAI 与中国大陆市场互动的历史脉络时,可以观察到其一贯持有的审慎姿态。
6/26/2024 10:52:00 AM
我在思考中
阿里云、智谱多家国产大模型公司宣布提供 OpenAI API 服务替代方案
感谢昨天陆续有 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的“警告信”,信中表示将采取额外措施停止其不支持的地区的 API 使用,IT之家此前已进行详细报道。此后,多家国产大模型公司宣布为开发者提供 OpenAI API 服务的替代方案,包括智谱、阿里云、百度智能云等。智谱:推出 OpenAI API 用户“特别搬家计划”,帮助用户切换至国产大模型。其 GLM 大模型号称全面对标 OpenAI 产品体系,且全链路技术自研、安全可控。为开发者提供:1.5 亿 Token(5000 万 GLM-4
6/26/2024 8:32:42 AM
清源
OpenAI收购远程协作公司Multi,并终止对中国提供API服务,智谱提供「搬家计划」;剂泰医药完成1亿美元融资丨AI情报局
融资快报剂泰医药完成1亿美元C轮融资:剂泰医药是专注“AI 药物递送”的创新型生物技术公司,本轮融资由中金资本旗下基金领投,中国太平旗下太平香港保险科创基金跟投。 此前已获得的红杉中国、国寿股权、人保股权、五源资本、峰瑞资本、源码资本、光速光合、砺思资本等顶尖投资机构投资。 久痕科技获得数千万元种子轮投资:久痕科技是一家关注知识工作的人工智能开发商,公司的第一款产品是以个人数据为中心的通用办公助理。
6/25/2024 4:15:00 PM
我在思考中
OpenAI 将采取额外措施,停止其不支持的国家和地区的 API 使用
感谢今日陆续有 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的“警告信”,信中表示将采取额外措施停止其不支持的地区的 API 使用。信中写道:“根据数据显示,你的组织有来自 OpenAl 目前不支持的地区的 API 流量。从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAI 支持的国家、地区名单上的 API 使用。”受影响组织若希望继续使用 OpenAI 的服务,必须在其支持的国家或地区内访问。IT之家注意到,目前 OpenAI 的 API 已向 161 个国家和地区开放,中国内地
6/25/2024 11:02:06 AM
远洋
科大讯飞刘庆峰:今年 6、7 月就能赶上 GPT-4 目前水平
在澳门举行的 BEYOND 国际科技创新博览会上,科大讯飞董事长刘庆峰表示,中美在通用大模型底座上的差距,是半年到一年半之间的动态追赶,不会被甩开,“我们与 GPT-4 的差距在半年之内,今年 6、7 月前后就能赶上 GPT-4 目前水平。一旦 GPT-5 发布后,差距可能会被拉到约一年,但我们会再次赶上。”刘庆峰表示,GPT-4o 的底层逻辑还是 GPT-4,科大讯飞能在今年 6-7 月赶上,中美在 AI 大模型差距是半年时间,在这个基础上有可能在垂直领域比美国做的更好。因为中国互联网领域基础设施、创新模式比美国
5/22/2024 8:14:39 PM
远洋
程序员问答平台 Stack Overflow 宣布与 OpenAI 建立 API 合作伙伴关系
感谢程序员问答平台 Stack Overflow 与 OpenAI 今天宣布建立新的 API 合作伙伴关系。OpenAI 和 Stack Overflow 将通过 OverflowAPI 为 OpenAI 用户提供所需的准确、经过审核的数据基础,以便 AI 工具快速找到问题解决方案,令技术人员能够专注于高优先级的任务;OpenAI 还将在 ChatGPT 中直接显示来自 Stack Overflow 的经过验证的技术知识和代码。作为合作的一部分:OpenAI 将使用 Stack Overflow 的 Overflo
5/6/2024 11:13:48 PM
泓澄(实习)
5亿个token之后,我们得出关于GPT的七条宝贵经验
ChatGPT 正确的使用姿势。自 ChatGPT 问世以来,OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月,OpenAI 官方宣布,开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。一年过去了,OpenAI 的大模型使用体验究竟如何,行业内的开发者怎么评价?最近,初创公司 Truss 的 CTO Ken Kantzer 发布了一篇题为《Lessons after a half-b
4/19/2024 4:08:00 PM
机器之心
OpenAI 推出 Batch 批处理 API:半价折扣,24 小时内输出结果
感谢OpenAI 今天凌晨面向开发者推出 Batch 批处理 API,可在 24 小时内给出结果,并提供 API 半价折扣。新的 Batch API 适用于异步任务处理,如当开发者需要处理大量文本、图片、摘要时,就可以使用该 API,OpenAI 会在 24 小时内给出处理结果。这样 OpenAI 可以在非高峰期处理,节约服务器资源,并为开发者提供半价优惠,解锁更高的速率限制。新的 Batch API 支持使用以下模型:gpt-3.5-turbogpt-3.5-turbo-16kgpt-4gpt-4-32kgpt-
4/16/2024 2:39:32 PM
泓澄(实习)
Meta官方的Prompt工程指南:Llama 2这样用更高效
随着大型语言模型(LLM)技术日渐成熟,提示工程(Prompt Engineering)变得越来越重要。一些研究机构发布了 LLM 提示工程指南,包括微软、OpenAI 等等。最近,Llama 系列开源模型的提出者 Meta 也针对 Llama 2 发布了一份交互式提示工程指南,涵盖了 Llama 2 的快速工程和最佳实践。以下是这份指南的核心内容。Llama 模型2023 年,Meta 推出了 Llama 、Llama 2 模型。较小的模型部署和运行成本较低,而更大的模型能力更强。Llama 2 系列模型参数规模
1/29/2024 3:10:00 PM
机器之心
GPT-4 Turbo更强更便宜,GPTs、GPT商店最大亮点,这是OpenAI首个开发者日
机器之心报道机器之心编辑部真如 Sam Altman 此前所言,OpenAI 首届开发者大会为人们带来了一些非常棒的新东西。继今年春天发布 GPT-4 之后,OpenAI 又创造了一个不眠夜。过去一年,ChatGPT 绝对是整个科技领域最热的词汇。OpenAI 也依靠 ChatGPT 取得了惊人的成绩:总结来说,OpenAI 证实 ChatGPT 目前每周有超过 1 亿活跃用户,超过 200 万开者使用 API 等进行开发,与超过 92% 的财富 500 强公司合作。作为备受期待的首届开发者大会,Altman 今天
11/7/2023 7:22:00 AM
机器之能
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
首月 1 美元,ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊