Model-Optimizer

Developpement et assistance au code

Model-Optimizer (NVIDIA/Model-Optimizer) est un projet d'IA open source sur GitHub. Résumé du référentiel : une bibliothèque unifiée de techniques d'optimisation de modèles SOTA telles que la quantification, l'élagage, la distillation, le décodage spéculatif, etc. Elle compresse les modèles d'apprentissage en profondeur pour les cadres de déploiement en aval tels que TensorRT-LLM, TensorRT, vLLM, etc. afin d'optimiser la vitesse d'inférence. Son objectif comprend les flux de travail d'ingénierie centrés sur les développeurs. Il convient à l’extension, à l’intégration et à la livraison itérative dans des flux de travail réels.

Licence

Apache-2.0

Étoiles

2 599

Site officiel

https://nvidia.github.io/Model-Optimizer/

Fonctionnalités

Core : une bibliothèque unifiée de techniques d'optimisation de modèles SOTA telles que la quantification, l'élagage, la distillation, le décodage spéculatif, etc. Elle compresse les modèles d'apprentissage en profondeur pour les cadres de déploiement en aval tels que TensorRT-LLM, TensorRT, vLLM, etc. afin d'optimiser la vitesse d'inférence.
Construit pour la génération de code, le débogage ou l'intégration technique
Dépôt : NVIDIA/Model-Optimizer
Langage principal : Python
Licence open source : Apache-2.0
GitHub : environ 2 599 étoiles

Cas d'usage

Prend en charge les flux de travail de création et d'itération d'ingénierie IA pour les équipes de développement
Créer des prototypes de flux de travail d'IA internes avec Model-Optimizer
Valider Model-Optimizer dans des scénarios d'ingénierie de type production
Créer des workflows de développement d'IA
Automatisation des processus basés sur des agents
Améliorer la productivité de l'ingénierie des équipes

FAQ

Cas d'usage courants : Prend en charge les flux de travail de création et d'itération d'ingénierie IA pour les équipes de développement, Créer des prototypes de flux de travail d'IA internes avec Model-Optimizer, Valider Model-Optimizer dans des scénarios d'ingénierie de type production.

Outils associés

GitHub Copilot

Outil de complétion de code

Cursor

Éditeur de code AI

Augment Code

Aide les équipes d’ingénierie à livrer plus vite dans de vrais codebases