关键功能

根据文本提示、歌词或参考音频生成长达六分钟的完整歌曲
对引子、主歌、副歌和桥段等歌曲部分的细粒度风格控制
支持包括英语、中文、日语、韩语和西班牙语在内的多语言
12.5 Hz 的高保真音频编解码器,捕捉长期结构和细节
用于视频背景音轨的短音乐模式
用于从参考音频创建歌曲翻唱的 Audio2Music 功能
对流派、情绪、节奏和表现力变化等可控属性的支持
与 AMD GPU 等消费级硬件兼容的本地、开源操作

核心的 HeartMuLa 模型充当一个基于 LLM 的歌曲生成器,接受灵活的用户可控条件,如文本风格描述、详细歌词和参考音频输入。它在多语言支持方面表现出色,涵盖英语、中文、日语、韩语和西班牙语等,使其对全球创作者都很友好。专业化的模式增强了其多功能性:细粒度的音乐属性控制允许用户使用自然语言提示为引子、主歌、副歌和桥段等不同歌曲部分指定风格,而短音乐生成模式则可以生成适合视频背景音轨的引人入胜的片段。


HeartMuLa 专为研究和创意工作流程而构建,支持对流派、情绪、节奏和表现力变化等元素的详细控制,使其成为强大的音乐制作工具。其分层架构即使在本地环境中也能确保高保真输出,演示表明其性能可与专有系统相媲美。作为一个基于 Apache 2.0 的开源解决方案,它促进了人工智能驱动音乐的创新,通过 Audio2Music 功能支持翻唱,并鼓励社区为非商业用途乃至现已可商用的应用进行开发。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!