MusicLM 的底层架构建立在一个由 280,000 小时音乐组成的庞大数据集上,该数据集经过精心策划,包括由人类专家提供的丰富文本描述。这种广泛的训练使模型能够理解复杂的提示,这些提示不仅详细说明了流派和情绪,还详细说明了特定的乐器和上下文元素。例如,用户可能会输入提示,例如“一段舒缓的小提琴旋律,伴有失真的吉他即兴重复乐段”,MusicLM 会生成一段反映此描述的音频片段。
MusicLM 的突出功能之一是它能够根据详细说明生成音乐样本。用户可以指定各种参数,包括所需的流派、乐器和情绪基调。然后,AI 根据这些提示生成两个音频片段,每个片段通常持续约 20 秒。此功能允许音乐家和制作人快速获得免版税样本,这些样本可以合并到他们的项目中,而无需广泛的音乐制作技能。
尽管 MusicLM 功能强大,但并非没有局限性。生成的音频通常具有模糊或低保真质量,可能不符合经验丰富的制作人所期望的专业标准。此外,虽然 MusicLM 可以创建引人入胜的音乐创意和片段,但它目前不支持按需生成完整长度的曲目。相反,它更像是一个样本生成器,为用户提供大量短片,这些短片可以作为进一步开发的灵感或起点。
MusicLM 还通过其界面强调用户参与度,这要求用户对其提示进行描述以获得更好的结果。生成的音乐的质量在很大程度上取决于用户以文本形式表达想法的能力。这种互动性鼓励用户尝试不同的描述并改进他们的提示以获得最佳输出。
该平台目前可通过 Google 的 AI Test Kitchen 访问,用户可以申请早期访问以探索其功能。作为此实验阶段的一部分,鼓励用户通过向他们特别喜欢的曲目颁发“奖杯”来对生成的曲目提供反馈。此反馈循环旨在帮助随着时间的推移改进模型。
虽然所审查的来源没有提供具体的定价细节,但 MusicLM 在早期访问阶段是免费提供的。
MusicLM 的主要功能:
- 文本到音乐生成:根据详细的文本描述创作原创作品。
- 广泛的流派和风格选项:能够根据用户的规范制作各种流派的音乐。
- 短音频片段输出:根据用户提示生成两个 20 秒的音频样本。
- 用户驱动的输入:需要描述性提示才能有效输出,鼓励创造性实验。
- 反馈机制:允许用户对生成的曲目进行评分,有助于持续改进模型。
- 可通过 Google 的 AI Test Kitchen 进行访问:适用于想要探索其功能。
总体而言,MusicLM 是音乐家和内容创作者使用 AI 生成的音乐来增强其项目的强大工具。它能够将文本提示转化为音乐创意,为创造力开辟了新途径,同时提供了生成满足特定需求的独特音景的资源。