寻找最新最佳的影像学人工智能。浏览最全面的AI数据库,每日持续更新。
最新
XVerse 是一种新颖的多主体控制生成模型,能够在不干扰图像潜在变量或特征的情况下,对特定主体进行精确且独立的控制。它通过将参考图像转换为特定于 token 的文本流调制偏移来实现这一点,从而实现高保真、可编辑的多主体图像合成。XVerse 还能对单个主体特征进行强大的控制,并对语义属性进行细粒度的操作,显著提升个性化和复杂场景生成的能力。
FLUX.1 Kontext 是一款先进的生成流匹配模型套件,专为高级图像生成和编辑而设计。与传统的文本转图像模型不同,FLUX.1 Kontext 支持真正的上下文图像生成,允许用户使用文本和图像提示系统。这种双重输入功能意味着您可以无缝地提取和修改视觉概念,从而生成新的、连贯的渲染图,同时保持原始场景的完整性。该模型旨在理解图像中元素之间的关系,确
HiDream-E1 是一款基于指令的先进开源图像编辑模型,构建于 HiDream-I1 的基础之上。HiDream-E1 专为爱好者和专业人士设计,使用户能够通过详细的自然语言指令修改图像,无需手动遮罩或复杂的编辑工具。用户只需上传图像并描述所需的变换,例如更改样式、移除或添加对象,或更改特定的视觉属性。该模型会解读这些指令,并生成高质量、情境感知的
Thera Image Upscaler 是一款先进的图像增强工具,旨在将低质量、模糊或像素化的图像转换为高分辨率、清晰锐利且细节丰富的视觉效果。它利用先进的神经热场技术,执行无混叠的任意尺度超分辨率处理,确保图像在放大后具有最小伪影和最大清晰度。该工具的工作原理是将图像分割成更小的局部热场,分别增强每个部分,然后无缝地重新组合它们,以生成清晰逼真的最
Bokeh Diffusion 是一个先进的文本转图像扩散模型框架,能够对生成图像中的散焦模糊(通常称为散景效果)进行精确且基于物理原理的控制。传统的扩散模型依赖于快速工程来近似景深效果(这通常会导致模糊效果粗糙或不一致,以及意外的场景变化),而 Bokeh Diffusion 则不同,它明确地根据物理散焦模糊参数来调节生成过程。这种调节允许用户平滑地
Lumina-mGPT 2.0 是一个先进的独立自回归模型,旨在将广泛的图像生成任务统一到一个统一的框架中。它采用仅解码器的架构从零构建,将大型语言模型中常用的顺序预测原理应用于图像像素和标记领域。这使得 Lumina-mGPT 2.0 能够根据先前的上下文预测下一个图像标记,从而生成连贯而复杂的视觉效果。与许多依赖于组合独立组件的模型不同,Lumin
Seedream 3.0 是字节跳动开发的新一代文本转图像基础模型,旨在以前所未有的速度和保真度生成高分辨率、中英文双语图像。该平台在技术能力和用户体验方面均实现了重大飞跃,提供原生 2K 分辨率输出,无需后期处理即可获得清晰细腻的视觉效果。Seedream 3.0 擅长将生成的图像与复杂的文本提示进行匹配,从而生成结构精准、美学精致的构图。其先进的架
UNO 是由字节跳动开发的通用图像生成框架,旨在为内容创作者和设计师提供前所未有的控制力和灵活性,从而生成高质量的图像。UNO 秉承“从少到多”的泛化原则,使用户能够创建具有出色一致性和保真度的单主题和复杂的多主题场景。该框架利用先进的扩散模型和创新的训练技术,确保特定对象或人物在不同图像中保持其独特特征,从而解决了 AI 驱动图像生成中长期存在的难题
InfiniteYou 是由字节跳动开发的一款先进的身份保留图像生成框架,旨在创建高度逼真且多样化的个人照片,同时保留其独特的面部特征。InfiniteYou 基于强大的 FLUX Diffusion Transformer 架构构建,用户只需提供参考照片和文本提示,即可在任何想象的场景或风格下生成无数张自己的新照片。与普通的换脸工具不同,Infini
HiDream-I1 是一个开源的高性能文本转图像生成模型,旨在将文本描述转化为照片级逼真且富有创意的视觉输出。HiDream-I1 基于先进的扩散模型架构,旨在满足研究和实际应用的需求,为用户提供一个灵活的框架,用于生成与其提示高度匹配的图像。该模型注重高保真度、细致入微的细节以及解读复杂指令的能力,使其适用于各种创意和专业用例。
Tensor.Art 是一个多功能的数字艺术平台,用户只需输入简单的文本提示或上传自己的模型,即可生成精美的图像和艺术作品。Tensor.Art 基于 Stable Diffusion 和 LoRA 等先进技术构建,面向广泛的受众,包括数字艺术家、设计师、业余爱好者和内容创作者。该平台支持从照片级写实肖像到抽象构图的各种艺术风格,并提供强大的自定义选项