寻找最新最佳的图形人工智能。浏览最全面的AI数据库,每日持续更新。
最新
DiffSensei 是一个专为生成具有动态多角色控制的漫画而设计的创新框架。它将基于扩散的图像生成器与充当文本兼容身份适配器的多模态大型语言模型 (MLLM) 相结合。这种方法无需直接像素迁移即可实现精确的布局控制,从而可以灵活调整角色的表情、姿势和动作。该框架解决了现有文本转图像生成模型的局限性,这些模型通常无法有效控制多角色场景中角色的外观和交互
FLUX.1 Krea [dev] 是一个 12B 参数整流模型,源自 Krea 1,这是 Krea 与 Black Forest Labs 的合作研究成果。该模型旨在提供卓越的美学控制和图像质量。代码库包含用于运行该模型的推理代码和 Jupyter Notebook,权重托管在 Huggingface 上。该模型是一个 CFG 提炼模型,与 FLUX
Qwen-Image 是一个强大的图像生成基础模型,能够进行复杂的文本渲染和精确的图像编辑。它在复杂文本渲染和精确图像编辑方面取得了显著进步,尤其是在文本渲染方面表现出色,尤其适用于中文。该模型是一个 20B MMDiT 图像基础模型,在图像生成和编辑方面都具有强大的通用功能。
Qwen-Image 的一大亮点是其跨多种图像的高
OmniPart 是一个用于生成零件感知型 3D 对象的新型框架,它在保持稳健结构内聚力的同时,实现了组件之间的高度语义解耦。该框架旨在克服传统生成方法仅能生成单一形状的局限性,从而限制了它们在交互式应用中的实用性。OmniPart 以独特的方式将复杂的 3D 对象生成任务解耦为两个协同阶段,从而能够创建具有明确、可编辑零件结构的 3D 资源。
Elevate3D 是一个新颖的框架,可将易于获取的低质量 3D 资源转换为更高质量的资源。它增强了低质量的 3D 模型,通过迭代纹理和几何细化将其转换为高质量资源。Elevate3D 的核心是 HFS-SDEdit,这是一种专门的纹理增强方法,可以在显著提高纹理质量的同时,保留外观和几何形状,并修复其质量下降的问题。
Elev
Ultra3D 是一个高效的 3D 生成框架,可在不影响质量的情况下显著加速稀疏体素建模。它利用紧凑的 VecSet 表示在第一阶段高效地生成粗略的对象布局,从而减少 token 数量并加速体素坐标预测。这种方法能够以 1024 的分辨率生成高分辨率 3D 图像,在视觉保真度和用户偏好方面均达到了最佳性能。
Ultra3D 的核
Diffuman4D 是一种从稀疏视角视频合成 4D 一致性人类视角的新颖方法。它能够从稀疏视角视频中对真人表演进行高保真自由视角渲染。给定稀疏视角视频,Diffuman4D 会根据这些输入生成 4D 一致性多视角视频,并使用输入和生成的视频重建真人表演的高保真 4DGS 模型。这允许实时渲染具有复杂服装和动作的真人表演的新视角。
原始分辨率图像合成 (NiT) 是一种新颖的生成式建模范式,能够合成任意分辨率和宽高比的图像。与传统的扩散模型不同,NiT 直接对原始分辨率图像数据进行建模,克服了固定感受野、位置编码和不稳定训练动态的局限性。这种方法使 NiT 能够在各种分辨率和宽高比下生成高质量图像,使其成为适用于各种应用的多功能工具。
NiT 引入了三项关
DreamO 是一个统一的图像定制框架,使用户能够生成具有各种条件的高质量图像。它支持广泛的输入,包括人物、物体和动物,并可用于图像到图像的转换、图像处理和图像生成等任务。DreamO 旨在成为一个灵活高效的框架,可用于各种应用,包括计算机视觉、机器人技术和图形学。
DreamO 建立在基于 VAE 的特征编码架构之上,使其能够
LightLab 是一种基于漫反射的方法,用于对单幅图像中的光源进行细粒度的参数化控制。它可以改变可见光源的强度和颜色以及环境光的强度,并可以将虚拟光源插入场景中。该方法利用漫反射模型的照片级真实感先验,通过描绘受控照明变化的配对样本,直接在图像空间中隐式模拟复杂的光效,例如间接照明、阴影和反射。
LightLab 支持丰富的照
Step1X-3D 是一个用于生成高保真且可控的纹理 3D 资源的开放框架。它通过严格的数据管理流程、两阶段 3D 原生架构以及模型、训练代码和自适应模块的完整开源版本,解决了 3D 生成中数据稀缺、算法限制和生态系统碎片化的挑战。该框架采用基于感知器的潜在编码和锐利边缘采样来保留细节,从而生成严密的 TSDF 表示。
Step
PS2 Filter AI 是一款动态在线工具,旨在将照片和视频转换为让人联想到 PlayStation 2 图形的独特视觉风格。该平台迎合游戏爱好者、内容创作者以及任何希望在数字媒体中注入怀旧气息的人。通过利用先进的算法,PS2 Filter AI 捕捉了 21 世纪初游戏美学的精髓,让用户重温历史上最受欢迎的游戏机之一的魅力。
Creately VIZ 是一款由 AI 驱动的视觉智能工具,旨在增强协作并简化创建图表和视觉模型的过程。它无缝集成到各种工作流程中,尤其是在 Microsoft Teams 中,允许团队根据自然语言提示生成视觉效果。此功能改变了团队与其想法和项目的互动方式,使复杂信息可视化和有效协作变得更加容易。
Creately VIZ 的
Diagram.chat 是一款人工智能图表工具,旨在简化各种图表的创建和管理,包括流程图、UML 图和组织结构图。该平台旨在通过提供直观的界面,利用人工智能简化图表绘制过程,从而提高专业人士、教育工作者和学生的工作效率。通过将用户友好的功能与先进的人工智能功能相结合,Diagram.chat 允许用户快速高效地创建复杂的视觉表示。
DGM 是一款免费的在线图表工具,可为 Web 和 AI 提供专业的图表。借助 DGM,您可以轻松使用智能形状创建各种类型的图表,将其发布到 Web 上,甚至借助视觉 AI 生成代码。该工具目前处于测试阶段,并提供一系列功能来增强您的图表绘制体验。
DGM 的主要功能包括:
Datalang 是一个人工智能平台,旨在通过让用户使用自然语言与数据库交互来简化数据查询。此工具对于可能不具备 SQL 或其他数据库交互通常所需的编程语言专业知识的非技术用户特别有用。通过允许用户以简单的英语提出问题,Datalang 使数据洞察更易于访问和直观,从而促进了更具包容性的数据分析方法。
Datalang 的主要功
Rows AI 是一款面向团队的一体化电子表格,将 AI 的强大功能与电子表格的功能相结合。借助 Rows AI,您可以更快地分析、总结和转换数据,从而在更短的时间内构建更好的电子表格。告别复杂的公式,享受快速洞察、深入挖掘以及直接在电子表格中提问和获得答案的能力。Rows AI 还提供文本分类和标记、社交媒体情绪分析、支持工单转换、反馈调查分析、产品
DiagramGPT 是一款由 AI 驱动的图表工具,可让用户根据文本描述快速高效地创建各种类型的图表。该平台专为专业人士、教育工作者和学生而设计,利用自然语言处理将简单的文本输入转换为详细的视觉表示。通过简化图表创建过程,DiagramGPT 让用户可以专注于自己的想法和概念,而不会陷入复杂的软件或技术术语中。
Diagram
ChartGPT Cadlabs 是一款先进的 AI 驱动工具,旨在通过对话分析改变数据体验。该平台使用户能够以更直观的方式与数据集交互,从而通过自然语言交互发现见解并可视化数据。通过将 AI 的强大功能与用户友好的界面相结合,ChartGPT Cadlabs 旨在让更广泛的受众能够探索数据,包括可能不具备丰富的数据分析技术专业知识的企业和个人。
ComfyUI 是一个功能强大且模块化的稳定的传播 GUI 和后端。它由 Comfyanonymous 于 2023 年 1 月创建。此用户界面允许您使用基于图形/节点/流程图的界面设计和执行高级稳定扩散管道。
以下是 ComfyUI 的一些主要功能: