MiniMax发布Music 2.5:实现段落级强控制与物理级高保真,华语AI音乐迈入专业制作新阶段
SmartHey1月29日消息,MiniMax 稀宇科技今日正式发布 MiniMax Music 2.5 音乐生成大模型,宣布在“段落级强控制”与“物理级高保真”两大核心挑战上取得实质性突破——让音乐创作更精准、更可控,让生成音质更真实、更接近录音室水准,甚至提出“格莱美级创作,无需依赖传统录音棚”。
MiniMax Music 2.5 全面开放全段落结构标签控制能力,精准支持 Intro(前奏)、Bridge(桥段)、Interlude(间奏)、Build-up(情绪铺垫)、Hook(副歌)等共计14种音乐结构单元,可灵活承载复杂编曲逻辑与多段落叙事型作品的完整表达。
用户可在创作初始阶段,即像专业编曲人一样规划整首作品的情绪演进节奏、高潮分布位置、主奏与伴奏乐器配置,告别过去“先生成、再筛选”的低效模式。
该模型通过在人声合成、风格建模与混音处理三个维度的系统性升级,显著提升AI生成音乐的整体听感品质,已达到主流商业发行所要求的专业制作水准。
MiniMax Music 2.5 特别针对华语流行音乐生态深度优化,全面覆盖抒情慢歌、快节奏说唱、纯中文演绎及中英文混合演唱等多种风格场景,在语音自然度、旋律记忆点与平台传播适配性等方面实现系统性增强。
在人声表现力方面,模型实现了连续细腻的转音处理、富有张力的自然颤音,以及胸腔共鸣与头腔共鸣的智能动态切换;在男女对唱等复合人声场景中,声线不再简单叠加,而是具备清晰的问答呼应逻辑与层次分明的和声织体。
音色资源方面,MiniMax Music 2.5 将内置乐器库扩展至100余种,并重构混音引擎,确保人声与各类伴奏声部之间保持高保真分离度,有效缓解AI音乐长期存在的声源混叠问题——即便在弦乐群奏、打击乐密集或电子音效叠加等复杂编配下,各声部依然清晰可辨。
此外,模型深度对接影视、游戏、音乐工业及品牌营销等专业场景:支持强叙事性的影视配乐生成、适配实时交互的游戏动态声场构建、满足唱片级交付标准的流行歌曲量产,以及面向品牌定制的风格化音频资产输出,均可达到行业认可的专业交付基准。
