寻找最新最佳的扩散模型人工智能。浏览最全面的AI数据库,每日持续更新。
最新
DIAMOND 是一种创新的强化学习代理,完全在扩散世界模型中进行训练。DIAMOND 由日内瓦大学、爱丁堡大学和微软研究院的研究人员开发,代表了强化学习世界建模的重大进步。
DIAMOND 的关键创新在于它使用扩散模型来生成世界模型,而不是像许多以前的方法那样依赖于离散潜在变量。这使得 DIAMOND 能够捕获更详细