寻找最新最佳的压缩人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Rotorquant 是一种用于大型语言模型推理的开源 KV 缓存压缩方法。它使用块对角旋转来降低缓存成本,同时保持质量,针对长上下文生成过程中出现的内存和吞吐量瓶颈。该存储库报告了比 TurboQuant 更好的困惑度、更快的解码、更快的预填充和更少的参数,使其对于实际推理优化非常有用。
从技术上讲,Rotorquant 通过块
Ternary Bonsai 是 PrismML 版本,专注于以 1.58 位提供顶级智能。它是围绕极端量化或低位模型表示而设计的,其目标是保留有用的推理和模型功能,同时大幅降低内存和计算成本。该产品与高效推理、边缘部署、模型压缩和低成本人工智能服务相关。
从技术上讲,1.58 位三元表示意味着模型权重以高度压缩的离散格式存储,通
TokenLight 是一个专注于人工智能模型工作流程中令牌级行为的研究项目。它专为想要了解、减少或优化令牌使用、令牌重要性或令牌级计算的用户而设计。该产品与 LLM 效率、可解释性、上下文优化和推理时间分析相关。
该系统可能会研究令牌如何影响输出质量、注意力行为或计算成本。令牌级方法可以支持重要上下文的修剪、突出显示、压缩、路由
GitPage 是一个现代化的网站构建和托管平台,专为希望直接从 GitHub 代码库创建专业网站的开发者和技术娴熟的用户而设计。该平台与 GitHub 无缝集成,只需极少的配置即可将代码库转换为功能齐全的网站。与传统的网站构建器不同,GitPage 允许用户直接使用现有代码库,同时提供强大的部署自动化功能,从而维护了开发者的工作流程。该服务支持 Je
作为一款 AI 驱动的视频/图像增强器,Winxvideo AI 可让您的视频/照片焕然一新,无论是旧的、低分辨率的、嘈杂的还是模糊的。它支持使用最精细的 AI 流畅高效地增强、升级、稳定、转换、压缩、录制和编辑 4K/HDR 视频,从而在每一帧中实现影院级的视觉效果。
该软件包括多种功能,例如图像 AI 和视频 AI