当前位置: > Linux新闻 >

昆仑万维发布全球首款音乐推理大模型 Mureka O1

时间:2025-03-28 16:33来源:linux.it.net.cn 作者:IT

昆仑万维宣布推出 Mureka O1 模型与 Mureka V6 模型。“Mureka O1 作为全球首款音乐推理大模型,性能超越 Suno、模型登顶 SOTA,中国科技创新再次在 AI 音乐领域领跑全球。”

2024 年 4 月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic)。Mureka V6 是当前 Mureka 的基座模型,支持纯音乐生成,还支持 10 种语言的 AI 音乐创作,包括英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语。在 Mureka V6 中,团队引入自研 ICL(in-context learning)技术,使得声场更加开阔,人声质感和混音设计进一步强化。

Mureka O1 模型是基于 Mureka V6 思维链的推理优化版本,也是全球范围内首个引入 CoT 的音乐模型,在推理过程中加入思考与自我批判,大幅提升音乐品质、音乐创作效率和灵活性。

Mureka V6 和 O1 模式支持多元化的音乐创作风格及情感表达。曲风涵盖爵士 (Jazz)、电子 (Electronic)、流行 (Pop)、乡村 (Country)、节奏布鲁斯 (R&B)、灵魂乐 (Soul)、蓝调 (Blues)、摇滚 (Rock)、舞曲 (Dance) 等;情感维度包括快乐、放纵、神秘、充满活力、悲伤等多种情绪表达。

此外,Mureka 还提供两个特色音乐生成功能:

  • 歌曲参考(Reference Fuction):将音乐本身作为提示,用户可直接上传音频或 Youtube 链接作为创作提示,比文本提示更直接更高级的提示方式;
  • 音色克隆(Vocal Fuction):Mureka 是全球首个可以指定演唱歌手音色的 AI 音乐生成平台,用户不仅可以选择官方提供的多种歌手音色,还可以上传自己的声音,让 AI 学习并复刻,精准模拟歌手音色,一键生成个性化专属作品。自定义歌手音色的功能宣告人人都能成为 AI 歌手的时代正式到来了。

Mureka O1 中包含了 Mureka 团队最新发布的音乐生成领域的创新研究成果 ——MusiCoT。根据介绍,MusiCoT 利用了思维链 Chain-of-Thought (CoT)方法,不同于传统自回归模型逐步生成音频,MusiCoT 首次在细粒度音频 token 预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度。

MusiCoT 基于 CLAP 模型,无需人工标注即具备高扩展性,并显著提高了生成音乐的可解释性和质量。

基于首次在音乐生成领域引入 Chain-of-Thought(CoT)技术、算法框架的升级,Mureka O1 不仅保持了低延迟音乐生成,还显著提升了歌词旋律契合度、演唱准确性和艺术表现力等,多项指标领先于 Suno V4。

(责任编辑:IT)
------分隔线----------------------------
栏目列表
推荐内容