AIGC宇宙 AIGC宇宙

Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍

最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。 他们接连发布了好些个开源模型,覆盖不同的领域,包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。 这样似乎也很难让这位欧洲 AI「新贵」感到满意,他们还想在应用层面好好地卷一卷 OpenAI。

最近几个月,由谷歌和 Meta 前研究人员建立的欧洲的 AI 初创公司 Mistral AI 有些躁动不安。

他们接连发布了好些个开源模型,覆盖不同的领域,包含号称「世界上最优秀」的 OCR 模型、「对标 Claude」的多模态模型、首个推理大模型 Magistral 以及两天前发布的「全球最佳」的开源语音模型 Voxtral。

这样似乎也很难让这位欧洲 AI「新贵」感到满意,他们还想在应用层面好好地卷一卷 OpenAI。

他们将 Le Chat 再一次升级,引入了一些强大的新功能,使其更强大、更直观,也更有趣,在功能上几乎全方位对标 ChatGPT。

image.png

Le Chat 的新功能

  • 深度研究模式:即使是复杂主题,也能快速生成结构化的研究报告。
  • 语音模式:使用我们的新 Voxtral 模型与 Le Chat 对话,而不是用键盘输入。
  • 原生多语言推理:借助我们的推理模型 ——Magistral,获取深思熟虑的答案。
  • 项目管理:将您的对话组织到内容丰富的文件夹中。
  • 高级图像编辑,在 Le Chat 中直接进行,与 Black Forest Labs 合作。

Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍

Le Chat 新功能宣传片

研究模式可将 Le Chat 转变为一个协调的研究助手,能够规划、明确需求、搜索和综合信息。提出一个有深度的问题,它会将其分解,收集可靠的资料,并构建一个结构清晰、有参考文献支持且易于理解的报告。

它由工具增强型深度研究 Agent 驱动,但设计得简单、透明且真正有帮助,仿佛与一个组织良好的研究伙伴合作。

Mistral AI 也在官网展示了一些用例。深度研究模式能够追踪市场趋势、撰写商业策略书、做个人计划以及最重要的、进行学术研究。

image.png

语音模式可以像和人聊天一样与 Le Chat 交流 —— 无需打字。你可以在散步时头脑风暴、在处理杂事时快速获取答案或转录会议内容。它由 Mistral 新的语音输入模型 Voxtral 驱动,专为自然、低延迟的语音识别而构建,能跟上用户的工作速度。

但目前 Le Chat 仅支持语音转文字的输入,该功能并非实时语音对话。

所以,跟电子助手聊天的功能依旧没有实现,更别提 Grok 4 Ani 那样的数字伴侣了。

在图像编辑功能方面,可以通过「移除物体」或「将我放置在另一个城市」等简单提示来创建并编辑图像。模型支持转换场景,同时保留角色和细节。这有助于保证编辑的一致性:可以保持人物、物体和设计元素在图像之间的不会变得认不出来。

图像编辑这块,Le Chat 似乎做得出人意料的好。网友在论坛分享了使用体验,认为 Le Chat 做得比 OpenAI 更好。

「OpenAI 的模型在编辑时会改变整个图像,导致无关区域出现细节错误。(Le Chat)似乎完美地保留了与查询无关的图像部分,并选择性地应用编辑,这令人印象深刻!」

image.png

网友上传了一张家庭办公室的照片,并提出了以下提示:「修复照片底部略微撕裂的灰色面板,让它们看起来像全新的」,编辑结果非常令人满意。

image.png

image.png

上图为原始图像,下图为编辑后图像

对于这些新功能,我们的读者想必已经非常熟悉。在这一次的大更新之后,Le Chat 在功能上基本实现了与 ChatGPT 等行业领先的产品保持一致。

最近 Mistral AI 的动作确实让人看到了欧洲在大模型领域保持追赶的势头。对此,网友们表达了对 Mistral 快速追赶的兴奋。

image.png

image.png

值得分享的是,Le Chat 在法语中意为「猫」,而 Mistral AI 的主页底部就有一只像素猫咪,Mistral AI 图标也形似一只猫猫头,非常可爱。

image.png

Mistral AI 的语音识别模型

7 月 15 日,Mistral AI 发布了全新的语音识别模型 Voxtral,号称是「全球最佳(且开源)」的语音识别模型。

image.png

Voxtral 在语音转写方面全面超越了 Whisper large-v3,当前领先的开放源代码语音转写模型。它在所有任务中都击败了 GPT-4o mini Transcribe 和 Gemini 2.5 Flash,并在英语短形式和 Mozilla Common Voice 上取得了最先进的结果,超越了 ElevenLabs Scribe,展示了其强大的多语言能力。

image.png

Voxtral 3B 和 Voxtral 24B 模型不仅仅具备语音转录功能,还具备以下能力:

  • 超长上下文理解:支持最长 32k token 的上下文,转录最长达 30 分钟音频,理解可达 40 分钟;
  • 内置问答与摘要功能:无需将语音识别与语言模型串联,即可直接针对音频内容提问或生成结构化摘要;
  • 原生多语种支持:具备自动语言识别功能,在全球主流语言(如英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等)中均达到业内领先表现,助力团队以单一系统服务全球用户;
  • 从语音直接触发函数调用:可根据用户的语音意图直接触发后端函数、工作流或 API 调用,无需中间解析步骤,实现语音到系统指令的无缝转换;
  • 强大的文本理解能力:延续其语言模型基础(Mistral Small 3.1)在文本处理方面的高性能表现。

相关资讯

「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了

昨晚,大模型领域再次「热闹起来」,月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。 而最近大热的 DeepSeek 正式推出了 DeepSeek-R1,同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。 去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮,实现了诸多的不可能。
1/21/2025 11:53:53 AM
机器之心

奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

近了,近了! 全网多个流出的代码截图显示,满血版o3、o4-mini,以及o4-mini high,有极大概率在下周发布。 不仅如此,在OpenRouter平台上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,据称就是o4-mini。
4/14/2025 9:17:00 AM
新智元

OpenAI深夜开源HealthBench,60个国家合力开发5000段真实对话

今天凌晨1点30,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。 与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。 并且采用了多轮对话测试,而不是简单的答题或选择题模式。
5/13/2025 9:08:00 AM
  • 1