嘉宾 | 陈亮、张云波
主持人 | 薛彦泽
撰稿 | 李美涵
在AI创业的浪潮里,最迷人的地方莫过于人人都知道这里是风口,却仍然能够各自找到属于自己的机会点。
在众多试图乘上AI风口的创业者中,亨宝科技的CEO张云波和AI创智坊的主理人陈亮无疑是特别的存在。
张云波早年投身于鸿蒙生态,今年年初就敏锐捕捉到DeepSeek大模型兴起的契机,迅速将注意力投向AI领域的应用开发。
他认为:“模型的强大,已经显著降低了开发的难度,因此开发本身不再是主要的挑战,重点是结合对特定行业的深入理解,才能开发出真正有竞争力的产品。”他所带领的团队,落地了一系列企业智能应用,通过可以克隆声音的数字人,探索了个人IP打造、数字人虚拟交互等前沿领域。
而陈亮则是一位因为AI大胆转行的“跨界者”,从互联网产品经理转型扎根于传统制造业,凭借对AI技术的敏锐嗅觉迅速完成身份转变。围绕AI在制造业的落地应用,他协助许多制造业中小企业实现AI商业化落地,清晰梳理出DeepSeek能够服务的业务场景与实际需求。
他指出:“AI圈的很多开发者都习惯‘炫技’,用非常复杂的智能体探索AI极限;然而,在商业落地中,往往是简单的、短链路的智能体更合适、更可控。”对行业需求与技术边界的深刻洞察,让陈亮的AI探索始终贴近企业的实际需求,他分享的智能声控灯、医疗模型案例能给人带来很多现实的启迪。
两人因一次线下会议而相识,共同撰写了《DeepSeek企业级AI应用实践》一书,试图通过更深入、更务实的方式,让AI真正落地到千行百业。
在4月23日51CTO独家技术访谈栏目《AI创客说》中,我们邀请到张云波和陈亮两位嘉宾,从模型部署、AI智能体的落地挑战,到AI产品设计与实际场景匹配,深度探讨AI时代下技术落地的实践与方法论。
以下是访谈的具体内容整理,供各位朋友参考和阅读。
1.智能体构建有哪些误区?
陈亮: 今天我们在聊一些偏商业化落地的一些话题,那我就重点说说这个领域的误区:
首先,AI圈的很多开发者都习惯“炫技”,用非常复杂的智能体探索AI极限;然而,在商业落地中,往往是简单的、短链路的智能体更合适、更可控。一旦智能体采用了复杂的模型拼接和长链路,出错的风险就会不断增加、成本失控,最终效果不佳。
其次,企业在应用智能体时,不能“拿着锤子找钉子”,应该先明确自身商业问题和需求。例如,对于一些中小企业,如果对自身商业模式的理解不够清晰,或者业务场景不适合智能体的应用,导致智能体构建的非常鸡肋,其使用频率自然提不上去。
最后,智能体构建要有一个清晰的认知,第一点是要了解各个模型的上下限,第二点是要了解各个平台智能体搭建的流程和效果。如果企业对自身数据化理解不足,知识库内容未经清洗和质量保证,那么智能体的输出结果也难以达到预期。此外,本地化部署并不适合所有企业,尤其是中小企业。公开平台的智能体服务已经能够满足大部分需求,企业应根据自身实际情况选择合适的方案。
张云波:陈亮老师刚刚聊到的观点我也很认可。由于智能体目前仍存在较高的错误率,企业在尝试将智能体引入业务流程时,应该谨慎选择强交付场景和核心业务场景,更推荐从边缘业务入手。举个例子,我们之前做一个项目,是语音控制的智能灯具,可以通过自然语言交互。当用户说“太暗了”,模型可能不是每次都能理解意图是要将灯调亮,有时反而会关掉灯——如果这是应用在手术室的,那么一点错误都是不可接受的。
其次,DeepSeek爆火后有些媒体浮夸的吹捧,非常影响中小企业的判断,使他们认为智能体无所不能,夸大了其对业务上的助力。但实际上,智能体在承载能力和稳定性方面还存在明显不足,可能承载百人的体量就会出现崩溃,没有到达可依赖的程度。
但是我认为它是可以做一些初步的工作,比如为产品经理跑个demo;做些创意设计、UI 设计的草稿,智能体是可以胜任部分任务的。
2.DeepSeek也能编辑图像?多模态推理还有多远?
陈亮:DeepSeek 多模态能力比较局限,因为它最开始设计时,就是基于多个专家模型加上一个小的微调模型,可能更聚焦在数学和代码方向。
随着技术发展,其他模型已经逐渐跟上并超越了它,比如GPT-4o ,它才是真正意义上的多模态大模型,无论是图像生成、语音对话,还是对文字和视频的理解,都做得非常出色。这其实也给其他模型带来了很大压力,未来多模态肯定是大模型的必经之路,所有模型都无法绕过这个方向。
目前来说, DeepSeek 的图像功能还是简单的一个 OCR技术,只能对图片中的文字进行识别,然后用大模型进行分析,这种应用相对有限。在生图方面,只能作为一个 Prompt 生成工具,辅助其他制图工具使用。所以从多模态角度来看,DeepSeek 确实比较弱。
张云波:其实 DeepSeek目前也有图像功能,但多模态功能还不够成熟,和其他的AI工具相比有一定差距。不过,AI 领域发展速度非常快,产品几乎每个月都在更新迭代,竞争非常激烈。作为技术人员或用户,其实没必要死盯着某一个模块,而是应该灵活选择当前最先进的工具来满足需求。比如最近很火的 GPT-4o 吉普利风格的图像生成工具,它就能快速生成高质量的电商带货图片。
我觉得多模态推理在未来肯定会和其他先进工具结合得更好。虽然 DeepSeek 的第一个版本还比较粗糙,但我相信它很快会推出更强大的多模态功能,至少不会比 GPT 差。
3.用DeepSeek进行产品设计,如何满足用户需求?
陈亮:回归到产品本身来说,AI产品在开发流程上与传统应用并无太大区别,关键在于如何发挥AI的能力,挖掘更具创意的产品方向。更重要的一点,我认为是AI产品更注重垂类性,即在一个小方向上做到极致,形成内容壁垒。未来可能会出现很多小而美的锤炼型公司,团队规模虽小,但能服务大量用户。
我关注到杭州的一家AI公司,最开始是做AI植物识别的应用。从现在来看,实现这样一个功能,从技术角度看并不太难,但核心在于大量植物数据的积累,可能成为他们的核心竞争力。
在未来选择AI创业的方向上,很多开发者需要对自己有重新的认识,更多地去做带有创意性的东西,为用户带来情感和功能上的价值,无论是软件还是硬件都是如此。我觉得也不该局限于是否是所谓的“套壳”应用,用户关注的是产品是否真正解决了需求,而非形式。大模型是实现功能的底座,开发者应将关注点放得更长远。
张云波:刚才陈亮老师讲的,更多地是把AI当做工具,实现自动化的一些功能,确实与传统的设计区别不大,但现在用大模型去解决问题就非常高效,甚至连代码都不用写。比如我刚才提到的公厕中的智能声控灯,现在我把灯接一个 wifi 模块接到这个华为云或者小米云之类的物联网平台上,再给大模型发个指令,就完成了产品的搭建,几乎是0成本的。
再比如数字人的应用,这就是挖掘了电商行业长期的痛点,极大地降低了雇佣主播的成本。现在通过大模型,用户可以轻松克隆自己的声音和口型,并且相似度越来越高。这种技术可以应用于短视频工具或直播领域,帮助用户快速生成个性化内容,甚至形成新的商业模式。
4.聊一聊常用的DeepSeek集成开发工具
陈亮:首先谈谈部署工具吧,从我的观察出发,企业应该明确自身的需求和场景,而不是盲目追求本地化部署或技术上的微调。我觉得对大部分的中小公司是本地化部署必要的。更多的是在工具选择时,去看有没有一些成熟的平台可以帮助我们搭建AI能力,从而真正赋能自己的业务场景。
目前API已经成为了一个主流的选择,甚至是像字节扣子这种,平台级的智能体,本身就集成了多家主流大模型,直接融合好了给用户使用。
如果一定要进行本地化部署,推荐使用Ollama 来去结合本地化的模型,再配合一些开源的工具。
本地化部署的需求主要集中在两类企业:一类是拥有敏感数据的公司,它们通常已经具备强大的技术壁垒,会自行搭建专业团队来完成本地化部署;另一类是像医药行业这样拥有庞大知识库的企业,它们需要基于自身封闭且高效的知识体系进行研发,因此可能会考虑本地化部署。但对于一般企业来说,如果没有明确的需求和收益预期,本地化部署往往是不必要的。
在微调模型方面,企业需要考虑是否有足够全面且独特的数据集作为核心壁垒。如果企业只是拥有少量数据,那么使用知识库或向量库可能就足够了,无需进行复杂的微调。此外,政府机构等对数据安全要求极高的机构,可能会因数据敏感性而选择本地化部署,但这也需要谨慎评估成本与收益。
张云波:其实工具很多,如果专门聊智能体开发,可能常用的就那么几个:国内的扣子、Dify、FastGPT,国外也有几个类似产品,功能大同小异。如果企业需要在线服务,扣子是一个不错的选择,但其缺点是无法进行本地化部署。对于需要本地化部署的企业来说,像 Dify 这样的开源平台可能更适合,虽然其插件不如扣子丰富,但完全可以满足企业的基本需求。如果企业有更进一步的定制需求,可能需要与开源方合作开发,这是他们做开源的盈利方式。
我再补充一下,大家可以发现这些工具正在被大模型逐步地替代。例如,在Sora出现之前,大家可能会使用像ComfyUI这样的设计工具,但这些工具本身较为复杂,对用户不够友好。这种趋势同样出现在编程领域。我认为模型的强大,已经显著降低了开发的难度,因此开发本身不再是主要的挑战,重点是结合对特定行业的深入理解,才能开发出真正有竞争力的产品。
5.企业部署AI模型环境有哪些注意点?
张云波:简单项目可以用Ollama,复杂项目可以用VLM,这类工具各有优势,比如n8灵活性强,而国内常用的Dify 、FastGPT等开源工具也足够应对常见功能需求。DeepSeek在本地化集成、知识库和工作流等方面都有支持,这些并不是最难的部分。
在我看来,最难的部分其实是对业务的深刻理解,以及如何让技术真正助力业务。很多情况下,我遇到很多类似的情况,与客户沟通花得时间非常长,客户甚至都不知道自己究竟要用DeepSeek做什么。这就需要我们通过案例、知识和想象力去帮助他们梳理业务流程,明确需求。
另外一个难点其实是数据。例如医疗大模型,有些医院声称使用AI技术能以95%的准确率识别X光片,但实际效果可能并不理想。其中很大的问题出在数据上,一个数据集里可能包含1000条Q&A,很多可能是无效数据,而经常有些外包公司会忽略数据清洗这方面的工作,最后得到的结果一定很差。在开发过程中,不仅要关注技术实现,更要确保技术与业务需求的紧密结合,避免出现“为部署而部署”的情况。
陈亮:如果企业决定进行本地化部署,我认为有几个关键问题需要重点关注。首先,实际应用场景的吞吐量是核心考量之一,直接关系到算力的采购和模型选型,同时还要考虑现有数据库的质量,以及数据安全和合规性。这些因素都会直接影响本地化部署的落地效果。例如,算力成本很高,如果企业没有准确评估吞吐量,可能会采购过多算力,造成浪费。
其次,数据安全是本地化部署中必须解决的问题。企业需要确保敏感数据的隔离,防止用户通过prompt等方式获取核心数据。这包括设置不同部门的数据分割、权限访问控制以及加密传输等措施。此外,数据的持续迭代和版本管理也值得关注。随着新数据的产生,企业需要不断微调模型以提高效率,同时还要建立有效的回滚机制,以应对训练失败或出现问题的情况。这些其实都是真正在部署过程中很细节的问题,但都非常重要。
6.大模型应用开发目前有哪些挑战?
陈亮:我提一个比较特别但是必不可缺的一点,现在真正精通 AI和垂直领域知识的符合型人才非常少见,对于推动行业发展至关重要。随着AI技术的广泛应用,跨行业知识成为必备技能。我们需要对自己用AI深耕什么方向有明确的认识。
我自己就是从互联网转到的制造业,我发现有两个问题需要克服:首先是不同行业从业者认知的差异,其次是工作模式会有不同。互联网行业信息相对透明、信息壁垒较低,但传统行业如制造业的信息差很大,企业之间可能合作多年也无法深入了解对方的核心需求。因此,开发者需要花费更多时间和精力去调研和理解这些行业,才能更好地将AI技术与实际需求相结合。
7.AI创新项目如何获取灵感?
张云波:我的经验是尽可能多跟业内专业人士接触,积极参加相关会议,甚至是跨行业的活动。相比在网上搜索,线下的面对面交流往往更有效。网上的案例可能比较浅显,甚至有些真实性存疑,比如抖音上那些看似轻松赚钱的案例,我对其真实性就深感怀疑。我和陈老师就是线下参会认识的,和人交流不仅能接触到前沿的技术和工具,还能了解到不同行业对AI的真实需求和应用场景。
最近我参加了上海和北京的一些行业会议,甚至去微软在上海的智能体平台中心参观学习。我发现每家公司都有独特的工具和技术,有他们自己的奇思妙想,但它们的核心都是围绕需求展开的。
陈亮:我会发现很多的需求和灵感来自于对AI工具能力的深刻认知以及与具体场景需求的巧妙结合。这个需求就是行业人员交流他们的具体痛点,你去考虑怎样用现有技术去解决。
前面一段时间很火的小猫补光灯就是一个很好的案例,他的技术实现并不复杂,甚至他上手的时候可能没有代码能力。但因为挖掘到了女生拍照的补光需求,这个APP当时在榜单上的成绩很好。
虽然未来AI的应用场景会越来越多,但是开发者必须得是一个好学者,让AI成为提升个人能力的工具,比如通过与AI的对话和学习,它可以将你的能力从level 2提升到level 4,甚至更高,这是一个正向循环。但同时也需要警惕,如果过度依赖AI,不再自己思考,可能会陷入被动,就像现在很多人沉迷于抖音的推荐算法一样,我觉得那是很可怕的事情。
我还是希望大家在 AI 时代里尽量多多学习,然后能在自己感兴趣的领域扎深一些,走出自己的路。