寻找最新最佳的大语言模型人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Qwen 3.7 是 Qwen 大型语言模型版本,专为高级推理、代理工具使用、编码、多模式工作流程和一般助理任务而设计。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 Qwen 3.7 不是提供通用演示,而是针对具体的能力差距,并为用户提供一种更可控的方式来处理复杂的人工智能生成或人工智能
Step 3.7 Flash 是一个针对现实世界代理的高效多模式 Flash 模型,专为使用工具的代理而设计,这些代理可以理解图像、搜索网络、编排工具以及跨常见工具执行操作。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 Step 3.7 Flash 不是提供通用演示,而是针对具体的能力差
MiniCPM5-1B 是一种紧凑的 1B 级语言模型,专为高效指令跟踪、工具感知聊天以及轻量级本地或边缘部署而设计。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 MiniCPM5-1B 不是提供通用演示,而是针对具体的能力差距,并为用户提供一种更可控的方式来处理复杂的 AI 生成或 A
GPT Realtime 2 是 OpenAI 的实时语音模型,用于构建实时对话代理,这些代理可以在对话仍在进行时进行聆听、推理、说话和使用工具。它专为需要语音界面来完成实际工作的产品团队而设计,例如客户支持、日程安排、行程变更、车载辅助、教育和免提生产力。与简单的语音到文本加聊天机器人管道不同,GPT Realtime 2 是围绕单一实时代理体验中的
ZAYA1-8B 是 Zyphra 的紧凑型专家混合语言模型,旨在以较小的活跃参数预算实现高智能密度。该模型被设计为在推理、数学和编码方面表现强劲,同时保持足够高的效率,能够适用于更广泛的部署。它的发布突出了一条发展路径,即更小的活跃模型可以在有针对性的高难度基准测试中与规模大得多的开放权重系统和专有系统竞争。
该模型在 AMD
Gemma 4 是 Google 迄今为止功能最强大的开放模型系列,专为高级推理和代理工作流程而构建。它专为想要高质量模型行为以及开放模型的透明度和部署灵活性的开发人员而设计。该版本与编码助手、研究工具、本地应用程序和企业人工智能系统相关,这些系统需要比封闭 API 允许的更多控制。
Gemma 4 基于 Google 的开放模型
GLM 5.1 是 Z.AI 的旗舰大语言模型,专为长期任务、高级编码工作流程和代理自动化而设计。它专为需要模型的开发人员而构建,该模型可以遵循复杂的指令、使用工具、推理多步骤问题并在扩展的工作会话中保持一致性。该模型被定位为编码助手、自主代理和生产级应用程序工作流程的实用引擎。
从技术上讲,GLM 5.1 通过 Z.AI 开发人
Grok 4.3 是 xAI 的推理模型,适用于需要长上下文分析、工具感知工作流程以及通过 xAI API 进行经济高效的模型访问的开发人员。它专为需要比基本聊天模型更深入推理的任务而设计,包括多文档分析、代理工作流程、技术故障排除和结构化指令遵循。该模型位于更广泛的 Grok 开发者生态系统中,支持现代 API 功能和工具集成。
Ling2.6 Flash 是托管在 Hugging Face 上的开放模型,用于快速语言模型推理和工具感知助理工作流程。它专为需要可部署模型的用户而设计,该模型可以处理聊天、指令遵循和结构化交互,而无需仅依赖封闭的 API 访问。模型卡公开了配置详细信息,使其适合想要在自己的环境中检查、运行和集成模型的开发人员。
该模型包括详细
Mimo v2.5 pro是MiMo家族中的小米型号版本,旨在实现高级推理和实用的AI助手工作流程。它被定位为更强大的 Pro 变体,适合需要在编码、推理、指令遵循和复杂问题解决方面具有可靠性能的用户。该产品符合小米为开发人员和研究人员提供高性能人工智能模型的更广泛努力。
该模型对于需要简短聊天响应的工作流程非常有用。它可以支持技
Talkie 是一种 13B 老式语言模型,仅使用 1931 年之前的文本进行训练。它旨在模拟与对现代世界没有直接了解的语言模型的交互,使其成为研究训练数据如何塑造模型行为、期望和世界知识的独特工具。该产品既是一个对话模型,也是一个研究工具。
Talkie的价值来自于它的历史约束。由于它是根据 1931 年之前的文本进行训练的,因
Ternary Bonsai 是 PrismML 版本,专注于以 1.58 位提供顶级智能。它是围绕极端量化或低位模型表示而设计的,其目标是保留有用的推理和模型功能,同时大幅降低内存和计算成本。该产品与高效推理、边缘部署、模型压缩和低成本人工智能服务相关。
从技术上讲,1.58 位三元表示意味着模型权重以高度压缩的离散格式存储,通
TokenDial 是一个专注于生成语言模型中令牌级控制、分析或调整的研究项目。它专为需要更直接地处理令牌如何影响模型行为、解码和输出结构的用户而设计。该产品与 LLM 可解释性、可控生成、即时工程和推理时间引导相关。
该系统可能公开了一种在生成过程中检查或操纵令牌分布、令牌重要性或解码行为的方法。从技术上讲,令牌级别的干预可以影
TokenLight 是一个专注于人工智能模型工作流程中令牌级行为的研究项目。它专为想要了解、减少或优化令牌使用、令牌重要性或令牌级计算的用户而设计。该产品与 LLM 效率、可解释性、上下文优化和推理时间分析相关。
该系统可能会研究令牌如何影响输出质量、注意力行为或计算成本。令牌级方法可以支持重要上下文的修剪、突出显示、压缩、路由
DeepSeek V4 是 DeepSeek 发布的开源大型语言模型,专注于经济高效的长上下文推理、编码和代理功能。该预览版包括可实现更高性能的 DeepSeek-V4-Pro 和可实现更快、更经济使用的 DeepSeek-V4-Flash。两种变体都围绕 1M 上下文支持和双重思考或非思考模式进行定位,为用户提供跨深度推理和低延迟工作流程的灵活性。<
GLM-5V Turbo 是一种 Z.AI 视觉语言模型,专为图像和文本的快速多模态推理而设计。它是为需要 API 可访问模型的开发人员而构建的,该模型可以检查视觉输入、回答问题、提取信息以及参与结合语言和视觉的代理工作流程。当延迟和吞吐量很重要时,Turbo 定位使其特别有用。
从技术上讲,GLM-5V Turbo 通过 Z.A
GPT Rosalind 是 OpenAI 专门为生命科学研究构建的前沿推理模型。它旨在支持生物学、药物发现、化学、蛋白质工程、基因组学和转化医学的工作。该模型是为科学工作流程而构建的,其中对证据、实验计划、分子、基因、途径和生物背景的推理比一般聊天表现更重要。
该模型系列针对长期、工具繁重的科学工作流程进行了优化,并且可以通过
Claude Opus 4.7 是 Anthropic 的最新旗舰型号,与 Opus 4.6 相比具有显着改进。它专为需要仔细遵循指令和持续解决问题的高级软件工程、硬推理任务和专业工作流程而设计。该模型定位于需要在困难任务上获得高质量输出的用户,而不是成本最低的一般助理。
该模型可通过 Anthropic 产品和 API 界面进行