声网与 MiniMax 深化全球战略合作
SmartHey1月20日消息,近期,MiniMax 在港交所成功上市,同时其与声网进一步深化了战略合作关系。MiniMax 将领先的文本转语音(TTS)技术及多模态大模型能力,与声网的对话式 AI 引擎以及全球超低延时实时传输网络(SD-RTN)深度融合。此次强强联合将助力全球开发者与企业快速构建更具生命力、响应更敏捷、体验更拟人化的对话式 AI 产品。

早在2024年10月,声网便宣布与 MiniMax 联合推出国内首个 Realtime API,推动 AI 告别传统‘机械感’,实现更低延迟、更自然流畅的实时交流体验。
从模型能力走向真实世界的交互
随着生成式 AI 的迅猛发展,行业面临的核心挑战已不再是模型本身的质量,而是如何将高质量的 AI 输出转化为跨设备、跨复杂网络环境下的自然实时交互体验。

MiniMax 的 TTS 模型具备表达丰富、情感细腻且高度可控的语音生成能力,支持多种语言、语调和说话风格,能够精准传递情绪与语境。声网则发挥其在实时互动领域的核心优势,将 AI 生成内容高效转化为稳定流畅的实时交互,使 AI 表现更贴近人类沟通习惯。
此次合作的价值不仅体现在技术集成层面,更在于双方共同推动全球化 AI 实时交互生态的构建:
MiniMax 提供具备全球视野的前沿 AI 模型,其设计之初即面向多语言、多文化背景及高复杂度应用场景,确保广泛适用性。
声网则依托自研的 SD-RTN™ 全球实时网络,覆盖超过 200 个国家和地区,提供毫秒级低延时、优异的抗抖动能力以及大规模并发下的高质量音视频传输保障。
双方携手填补了当前 AI 生态中的关键空白——无论用户身处何地、使用何种设备或网络环境,都能享受稳定、自然、富有表现力的 AI 语音交互体验。
赋能下一代实时语音 AI 产品
声网与 MiniMax 的联合解决方案已在多个实际场景中落地应用,涵盖:
· AI 陪伴与智能硬件:需要即时语音反馈的高互动场景
· 实时语音 Agents:应用于客服系统与企业自动化工作流的智能交互代理
· 互动教育与内容平台:对语音自然度与全球服务覆盖有严苛要求的应用场景
· 多模态 AI 应用:需实现语音、视觉、情感与动作高度同步的复杂交互系统
通过整合能力,声网与 MiniMax 为开发者提供了从文本生成到实时语音交付的完整端到端对话式 AI 基础设施。随着 AI 技术从云端逐步渗透至日常生活的每一刻,双方将持续为开发者与企业提供强大、可靠的技术支撑。
展望未来,双方计划在实时语音智能体、AI 原生设备以及沉浸式多模态对话体验等方向持续拓展合作,共同推动人工智能进入更加智能、实时与人性化的时代。
