AIGC宇宙 AIGC宇宙

商汤科技迈向多模态大模型的新纪元

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。 尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。 商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。

商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。商汤不仅成功弥补了文本模型的差距,更在多模态领域厚积薄发,标志着其在国内大模型市场中越来越重要的地位。

元宇宙 科幻 赛博朋克 绘画 (5)大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

值得注意的是,商汤在构建其多模态模型的过程中,采用了独特的思维链构建方法。通过将文本、图像、语音和视频数据融合,商汤的日日新 V6能在同一上下文中进行有效的推理,达到1+1>2的效果。这一创新不仅提升了模型的理解与生成能力,也使得多模态之间的协同作用更加显著。

当前,尽管市场上出现了众多多模态模型,能够同时处理多种数据模态的产品依然屈指可数。商汤的日日新 V6凭借其在多模态数据融合方面的成功,逐渐显示出其在未来人工智能竞争中的强大潜力。

相关资讯

Midjourney v6 终于更新了!一文详解新版本 3 大要点

大家好,这里是和你们一起探索 AI 绘画的花生~ Midjourney 的 v6 模型终于在 2023 年结束之前更新出来了,这是一个完全重新训练的模型,所以图像生成效果与之前的 v5.2 相比有很大的不同,那么此次更新主要有哪些特点?我们又应该如何正确地用 v6 模型出图呢?今天就带大家一起了解一下~ 上期回顾:首先是 V6 的图像生成质量相比之前的模型来说又提升了不少,在画面质感以及细节刻画上有了更精致的表现,图像的光影处理也比 v 5.2 更真实自然。下面是分别用 v5.2 和 v6 生成的特写图像,通过对比
12/29/2023 1:03:38 AM
夏花生

高手总结!十五个 Midjourney V6 与 V5.1 镜头对比(附超多实用提示词)

最近人工智能新闻铺天盖地,属 OpenAI 耀眼,1 月 11 日推出 GPT 商店,由于登录的人数较多,网站一直登录不上,只能耐心等待... 本篇图片来自 @4rtofficial 相机镜头(部分)第二卷 PDF 文件。开头/文末已给出完整的 PDF 文件和福利。 更多V6 介绍:一、CANON EF 50MM F/1.8 STM LENS 佳能(Canon)EF 50mm f/1.8 STM 镜头的型号。这是一款标准定焦镜头,适用于街头摄影、旅行摄影等。焦距:50mm,是一款标准定焦镜头,适用于多种拍摄场景。
1/22/2024 7:22:52 AM
团队RaDesign

Midjourney 再更新!V6 模型支持外绘拓展与局部重绘了!

大家好我是花生~ 上周末 Midjourney 又更新了一波新内容,一是 V6 版本增加了 3 个功能,二是 Alpha 内测网站调低了进入门槛,用户只要生成图像超过 5000 张就能体验网站内的图像生成功能,今天就为大家详细介绍一下相关内容~ 相关推荐:一、V6 功能完善 此次更新最值得关注的就是 Zoom Out 外绘拓展、Pan 平移外绘和 Vary (Region) 局部重绘 3 种图像编辑功能终于能在 V6 版本中使用了,用法还是和之前也是一样的:先将图像放大,然后通过底部的按钮进行对应操作。官方提到 V
1/30/2024 1:14:20 AM
夏花生
  • 1