核心的 HeartMuLa 模型充当一个基于 LLM 的歌曲生成器,接受灵活的用户可控条件,如文本风格描述、详细歌词和参考音频输入。它在多语言支持方面表现出色,涵盖英语、中文、日语、韩语和西班牙语等,使其对全球创作者都很友好。专业化的模式增强了其多功能性:细粒度的音乐属性控制允许用户使用自然语言提示为引子、主歌、副歌和桥段等不同歌曲部分指定风格,而短音乐生成模式则可以生成适合视频背景音轨的引人入胜的片段。
HeartMuLa 专为研究和创意工作流程而构建,支持对流派、情绪、节奏和表现力变化等元素的详细控制,使其成为强大的音乐制作工具。其分层架构即使在本地环境中也能确保高保真输出,演示表明其性能可与专有系统相媲美。作为一个基于 Apache 2.0 的开源解决方案,它促进了人工智能驱动音乐的创新,通过 Audio2Music 功能支持翻唱,并鼓励社区为非商业用途乃至现已可商用的应用进行开发。

