/ 生成

生成 AI

寻找最新最佳的生成人工智能。浏览最全面的AI数据库，每日持续更新。

DiffusionGemma

NewFree大语言模型开源

DiffusionGemma 是 Google 推出的基于扩散的文本生成模型，被定位为标准自回归解码的超快替代方案。公告称，它通过并行细化文本而不是严格逐 token 生成，可实现最高 4 倍更快的文本生成。

该模型将扩散思想应用到语言上，从带噪或不完整的文本状态出发，逐步去噪得到最终答案。这改变了交互式助手、批量生成系统，以及需

StreamForce

NewFree视频生成

StreamForce 是一个流式视频生成框架，允许用户在视频生成过程中施加并修改物理力。它从单张图像出发，支持对局部推动和风等全局效应进行因果控制，让运动操控变成交互式过程，而非完全预设脚本。

该方法聚焦于通过连续力输入实现物理上更合理的控制。页面展示了全局和局部力控制、实时交互、下落与弹跳、质量感知运动、摩擦感知运动，以及生成

HeartMuLa

NewFree音乐生成

HeartMuLa 代表了一系列突破性的开源音乐基础模型，旨在通过先进的组件（如用于音频-文本对齐的 HeartCLAP、用于真实场景中鲁棒歌词识别的 HeartTranscriptor，以及用于高保真、低帧率音乐分词的 HeartCodec，后者在保留长期音乐结构的同时兼顾细致的声学细节）来统一音乐生成与理解。该框架支持高效的自回归建模，使用户创作者

GLM Image | z.AI

NewFree生成图像合成

GLM-Image 是一种先进的图像生成模型，其特点是创新的自回归和扩散解码器混合架构。这种双重方法使其在视觉质量上可与主流的潜在扩散模型相媲美，同时在需要密集知识和精确文本渲染的任务中表现出显著的优越性。其架构经过精心构建，包含一个从强大语言模型基础初始化并扩展以处理视觉令牌的大型自回归生成器，该生成器首先构建一个紧凑的编码，然后将其细化为高分辨率的

Averi AI

NewPaid营销团队协作

Averi AI Marketing Workspace 是一个全面的平台，旨在让营销团队能够无缝地将生成式人工智能的力量与关键的人工专业知识相结合，以管理整个营销生命周期。这种统一的流程涵盖了从初步战略规划和内容创建到最终执行和活动扩展的所有内容。通过集中处理这些通常需要使用多个不相关工具来完成的功能，Averi 旨在简化运营，确保品牌声音的一致性，

BananaImg AI

NewFree有创造力的图像生成

使用 Nano Banana AI 平台释放您的创造力。借助 Nano Banana AI 图像生成器支持的先进 Nano Banana AI 技术，轻松创作出卓越的艺术作品、插图和视觉内容。该平台旨在简化创作流程，让您轻松将简单的想法转化为令人惊叹的视觉效果。对于任何希望快速高效地生成高质量图像的人来说，这都是一个全面的解决方案，无论他们的技术专长如

OmniVCus

NewPaid视频视频编辑

OmniVCus 是一种前馈式主体驱动的视频定制方法，允许多模态控制条件。它可以组合不同的输入信号来定制视频，包括主体图像、文本指令、深度序列、掩模序列和摄像机轨迹。该方法旨在通过激活更多训练主体的帧嵌入来实现推理中的多主体定制，并通过对齐条件标记和噪声标记的帧嵌入来从控制信号中提取指导。

OmniVCus 已被证明在各种视频定

Epona

NewPaid自主驾驶技术

Epona 是一个专为自动驾驶设计的自回归扩散世界模型。它通过两项关键创新实现了局部时空分布建模：解耦时空分解以及模块化轨迹和视频预测。这能够生成高分辨率、长时长的未来驾驶场景，并进行实时运动规划。Epona 的架构旨在突破传统视频扩散模型的局限性，这些模型难以进行灵活长度、长时域预测以及集成轨迹规划。

Epona 的世界模型利

Hi3DGen

New3D几何生成

Hi3DGen 是一个尖端框架，旨在利用一种新颖的法线桥接技术，从单张 2D 图像生成高保真 3D 几何体。由于 RGB 图像中的域间隙、光照变化和固有的模糊性，传统方法通常难以准确再现细粒度的几何细节。Hi3DGen 通过将图像到几何体的生成过程分解为两个阶段来解决这些挑战：首先，使用注入噪声的双流网络从图像中估计详细的法线图，该网络可以稳定和锐化预

OmniSVG

New设计矢量图形

OmniSVG 是一个创新的统一框架，通过多模态方法生成高质量的可缩放矢量图形 (SVG)。OmniSVG 由复旦大学和 StepFun 团队开发，利用先进的预训练视觉语言模型，将文本描述、光栅图像或字符引用转换为完全可编辑的矢量图形。与通常生成非结构化或过于简化的 SVG 的传统工具不同，OmniSVG 擅长创建复杂、视觉吸引力强且逻辑清晰的矢量图形

Colorendo

New图像生成教育

Colorendo 通过一个直观的平台，将创意转化为可打印的涂色页，无需任何艺术技能。用户只需用简单的词语描述他们的构想，例如“神奇的独角兽森林”或“太空探索机器人”，系统即可在几秒钟内生成详细的线条图。该工具迎合了不同的兴趣和年龄段，从适合幼儿的大胆简约设计，到适合成人的复杂图案，应有尽有。免费试用版允许用户使用 10 页初始页面探索核心功能，而高级

Origin AI

New编程企业

Origin AI 彻底革新了企业软件开发，用 AI 驱动的代理取代了传统的产品团队，将业务需求转化为可立即投入生产的应用程序。该平台使企业无需维护庞大的开发团队即可创建定制的软件解决方案，并使用自主代理处理从初始概念到部署的所有任务。企业可以通过自然语言界面快速构建原型并进行迭代，系统会自动生成代码、管理基础架构并确保符合行业标准。这种方法显著缩短了

TRELLIS 3D

Humanize.im

写作文本转换, SEO优化

Humanize.im 是一款先进的 AI 工具，旨在将 AI 生成的文本转换为自然、类似人类的散文。该平台解决了 AI 生成内容的常见挑战，这些内容通常听起来机械或缺乏情感深度，这可能会阻碍读者的参与。通过利用复杂的算法和自然语言处理技术，Humanize.im 将机器人输出转换为可关联且真实的写作，使其适用于各种应用，包括营销、博客和学术写作。</

Jogg

办公视频创作, 数字营销

Jogg 是一个人工智能视频创作平台，旨在简化制作引人入胜的视频内容的过程，特别是针对营销人员和电子商务专业人士。通过将 URL 或产品图片转换为动态视频，Jogg 简化了内容创作，让用户无需丰富的视频编辑技能即可访问。该平台针对各种应用量身定制，包括社交媒体营销、产品推广和网站流量生成。

Jogg 的突出功能之一是它能够将静态

Motiff

设计设计工具, 用户界面设计

Motiff 是一款专业的设计工具，它利用人工智能来增强用户界面 (UI) 设计流程。Motiff 于 2024 年在 SuperAI 峰会上推出，旨在通过提供一套强大的功能来简化工作流程并提高生产力，从而重新定义设计师和开发人员的协作方式。该平台专为个人设计师和团队设计，适合设计界的广泛用户。

Motiff 的主要功能之一是其

SQLyze

数据数据库查询, 数据分析

SQLyze 是一个人工智能驱动的平台，旨在简化创建和优化 SQL 查询的过程，使具有不同技术水平的用户都可以使用它。此工具对于需要高效与数据库交互的数据分析师、开发人员和业务专业人员特别有用。通过采用结构化的三步方法，SQLyze 简化了复杂 SQL 查询的开发，使用户能够专注于从数据中提取有价值的见解，而不是陷入语法的泥潭。

AI Tattoo Vision

图片纹身设计, 艺术创作

介绍 AI Tattoo Vision，AI 纹身生成器可让您梦想中的纹身创意变为现实。只需详细描述您的纹身概念，单击“生成”，我们的 AI 艺术家就会根据您的输入创建独特的设计。该工具提供高分辨率图像供您下载并与纹身艺术家分享，让您轻松将想法从想象变成墨水。

\n\n

AI Tattoo Vision 的使用案例包括：\n

Beat Shaper

音乐生成音乐, 音乐制作

Beat Shaper 是一个为音乐家和音乐制作人量身定制的生成式 AI 平台，旨在促进节拍、旋律、低音线和合成器预设的创作。此工具利用先进的生成算法帮助用户创作各种电子流派的独特音乐作品，包括 house、techno、hip-hop 和 drum & bass。通过将 AI 集成到音乐制作过程中，Beat Shaper 旨在增强创造力并简化各个技能

Linkquire

摘要视频摘要, 用户互动

Linkquire 是一款人工智能驱动的工具，旨在增强用户与 YouTube 视频互动和从中获取信息的方式。该平台旨在为用户提供视频内容的简明摘要和关键见解，让他们节省时间，同时仍然全面了解内容。只需将 YouTube 链接粘贴到 Linkquire 中，用户就可以收到视频要点和想法的详细摘要，而无需观看整个视频。

Linkqu