Soul

Soul App开源播客语音合成模型，可流畅自然多轮语音对话，支持川粤豫等多方言与副语言风格

Soul App AI团队（Soul AI Lab）正式开源播客语音合成模型SoulX-Podcast。该模型是一款专为多人、多轮对话场景打造的语音生成模型，支持中、英、川、粤等多语种/方言与副语言风格，能稳定输出超60分钟、自然流畅、角色切换准确、韵律起伏丰富的多轮语音对话。除了播客场景以外，SoulX-Podcast在通用语音合成或克隆场景下也表现出色，带来更真实、更生动的语音体验。

10/29/2025 4:35:27 PM

量子位的朋友们

Soul App实时人像视频生成研究成果获国际学术顶会CVPR2025录用

近期，IEEE国际计算机视觉与模式识别会议（ Conference on Computer Vision and Pattern Recognition）CVPR 2025公布论文录用结果，社交平台Soul App技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》（《基于自回归动作生成的实时流式音频驱动人像动画系统》）被接收。 Soul App团队在论文中提出了一个新的面向实时音频驱动人像动画（即Talking Head）的自回归框架，解决了视频画面生成耗时长的行业挑战外，还实现了说话时头部生成以及人体各部位运动的自然性和逼真性。此次论文的入选，也证明了Soul App在推动多模态能力构建特别是视觉层面能力突破上取得了阶段性成果。

3/21/2025 5:14:00 PM

新闻助手

AI时代如何重构社交？Soul App 通过媒体开放日活动这样回答

5月30日，社交平台Soul App在上海举办媒体开放日活动，以“人与人工智能是否能够真正成为「朋友」”为主题，分享了平台前沿技术探索和最新产品应用实践，并邀请了复旦大学教授肖仰华以及众多行业观察者，一同探讨AIGC＋社交的应用及未来发展可能性。媒体开放日活动是Soul与外界达成长效、深度链接的重要桥梁。在AI为各行各业带来颠覆式发展新机会的当下，Soul作为“AIGC 社交”领域前沿探索者，希望通过本次活动，全面展示Soul在AI方面的技术积累及落地实践，为行业提供可行的方向参考。模应一体：AI重构关系链与社交体

5/31/2024 2:04:00 PM

新闻助手

资讯热榜

DeepSeek-OCR：OCR 的新突破最具争议性研究：大模型中间层输出可 100% 反推原始输入 Soul App开源播客语音合成模型，可流畅自然多轮语音对话，支持川粤豫等多方言与副语言风格 OpenAI推出两款全新的开源安全推理模型 Wan2.2-Animate又火了！5分钟让抠脚大汉秒变高冷女神 DeepSeek-OCR：用视觉模态给长文本“瘦身”，大模型处理效率再突破奥特曼回应一切：重组后仍需微软支持，不相信OpenAI的欢迎做空 AI友好型组件库才是未来？4个特点帮你快速了解！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能 AI新词用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果腾讯 Claude Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人研究 AI视频大语言模型生成具身智能 Sora 工具 GPU 百度华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成场景深度学习架构生成式AI DeepMind 编程视觉 Transformer 预测亚马逊 AI模型 MCP 伟达