返回工具列表
TensorRT-LLM

TensorRT-LLM

学习辅助与翻译

TensorRT-LLM 是来自 NVIDIA/TensorRT-LLM 的开源仓库,当前摘要为:TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT LLM also contains components to create Python and C++ runtimes that orchestrate the inference execution in a performant way.。它适合作为开发者工程工作流场景下的技术参考或集成候选,不应使用空泛的 AI 工具描述。

开源协议

Other

星标

13,876

主要特性

  • 核心能力:TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT LLM also contains components to create Python and C++ runtimes that orchestrate the inference execution in a performant way.
  • 面向代码生成、调试或工程集成场景
  • 仓库:NVIDIA/TensorRT-LLM
  • 主要技术栈:Python
  • 开源协议:Other
  • GitHub 社区关注度:约 13,514 Stars

使用场景

  • 作为可复用开源组件进行技术评估
  • 在生产采用前比较实现成本和取舍

常见问题 FAQ

先从仓库摘要(TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT LLM also contains components to create Python and C++ runtimes that orchestrate the inference execution in a performant way.)判断能力边界,再核对维护状态、接入方式,以及它的“开发者工程工作流”定位是否匹配你的流程。仓库:https://github.com/NVIDIA/TensorRT-LLM。Stars 约 13,514。协议:Other。语言:Python。

TensorRT-LLM 更适合作为“开发者工程工作流”方向的开源组件或参考实现来评估。典型评估场景包括:当需求是“开发者工程工作流”,且仓库摘要匹配“TensorRT LLM provides users with an easy-to-use Python API to defin...”时,评估 TensorRT-LLM。在选择类似内部架构前,对比 TensorRT-LLM 的 Python 实现方式。使用 TensorRT-LLM 在搭建内部研发流程前研究开发工具实现细节。

相关工具