主要特点:
- 可用作 Python 命令行、Python API 和实验性 TFJS 版本(为我们的 Web 演示提供支持)。
- 在超过 100 种内容类型的超过 2500 万个文件的数据集上进行训练。
- 在我们的评估中,Magika 实现了 99% 以上的平均精确度和召回率,优于现有方法。
- 支持超过 100 种内容类型。
- 批处理:您可以同时将多个文件传递给命令行和 API,Magika 将使用批处理来加快推理时间。
- 与文件大小无关的接近恒定的推理时间; Magika 仅使用文件字节的有限子集。
- 支持三种不同的预测模式来调整对错误的容忍度:高置信度、中等置信度和最佳猜测。
- 开源,管道中还有更多增强功能。