返回工具列表
Model-Optimizer

Model-Optimizer

代码编程与辅助

Model-Optimizer 是位于 NVIDIA/Model-Optimizer 的开源仓库,可优先按“开发者工程工作流”评估;仓库摘要:A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed. 记录的主要语言为 Python。 协议元数据为 Apache-2.0。 GitHub 元数据显示约 2,599 Stars。 项目主页为 https://nvidia.github.io/Model-Optimizer/。

开源协议

Apache-2.0

星标

2,952

主要特性

  • 核心能力:A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.
  • 面向代码生成、调试或工程集成场景
  • 仓库:NVIDIA/Model-Optimizer
  • 主要技术栈:Python
  • 开源协议:Apache-2.0
  • GitHub 社区关注度:约 2,599 Stars

使用场景

  • 构建或扩展 AI 开发者工具链
  • 作为可复用开源组件进行技术评估
  • 在生产采用前比较实现成本和取舍

常见问题 FAQ

先从仓库摘要(A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.)判断能力边界,再核对维护状态、接入方式,以及它的“开发者工程工作流”定位是否匹配你的流程。仓库:https://github.com/NVIDIA/Model-Optimizer。Stars 约 2,599。协议:Apache-2.0。语言:Python。

Model-Optimizer 更适合作为“开发者工程工作流”方向的开源组件或参考实现来评估。典型评估场景包括:当需求是“开发者工程工作流”,且仓库摘要匹配“A unified library of SOTA model optimization techniques like quanti...”时,评估 Model-Optimizer。在选择类似内部架构前,对比 Model-Optimizer 的 Python 实现方式。使用 Model-Optimizer 在搭建内部研发流程前研究开发工具实现细节。

相关工具