html-to-markdown (kreuzberg-dev/html-to-markdown) est un projet d'IA open source sur GitHub. Résumé du référentiel : convertisseur HTML vers Markdown hautes performances et conforme à CommonMark. Entretenu par l'équipe de Kreuzberg. Kreuzberg est un moteur d'intelligence documentaire rapide et polyglotte avec un noyau Rust. Il extrait les données structurées de plus de 56 formats de documents à l'aide d'analyseurs de streaming et d'OCR intégré. Son objectif comprend la génération augmentée par récupération et les intégrations de collaboration en équipe. Il convient à l’extension, à l’intégration et à la livraison itérative dans des flux de travail réels.
Licence
MIT
Étoiles
739
Fonctionnalités
- Core : convertisseur HTML vers Markdown hautes performances et conforme à CommonMark. Entretenu par l'équipe de Kreuzberg. Kreuzberg est un moteur d'intelligence documentaire rapide et polyglotte avec un noyau Rust. Il extrait les données structurées de plus de 56 formats de documents à l'aide d'analyseurs de streaming et d'OCR intégré.
- Prend en charge la récupération vectorielle et le raisonnement augmenté par la récupération
- S'intègre à la collaboration d'équipe et aux systèmes d'entreprise
- Dépôt : kreuzberg-dev/html-to-markdown
- Langue principale : HTML
- Licence open source : MIT
Cas d'usage
- Construit des systèmes de questions-réponses et de récupération de documents sur les connaissances d'entreprise
- Utilisé pour la collaboration en matière de connaissances en équipe et le suivi des tâches
- Créer des prototypes de flux de travail d'IA internes avec HTML-to-markdown
- Valider le HTML vers Markdown dans des scénarios d'ingénierie de type production
- Créer des workflows de développement d'IA
- Automatisation des processus basés sur des agents
FAQ
html-to-markdown (kreuzberg-dev/html-to-markdown) est un projet d'IA open source sur GitHub. Résumé du référentiel : convertisseur HTML vers Markdown hautes performances et conforme à CommonMark. Entretenu par l'équipe de Kreuzberg. Kreuzberg est un moteur d'intelligence documentaire rapide et polyglotte avec un noyau Rust. Il extrait les données structurées de plus de 56 formats de documents à l'aide d'analyseurs de streaming et d'OCR intégré. Son objectif comprend la génération augmentée par récupération et les intégrations de collaboration en équipe. Il convient à l’extension, à l’intégration et à la livraison itérative dans des flux de travail réels.
Cas d'usage courants : Construit des systèmes de questions-réponses et de récupération de documents sur les connaissances d'entreprise, Utilisé pour la collaboration en matière de connaissances en équipe et le suivi des tâches, Créer des prototypes de flux de travail d'IA internes avec HTML-to-markdown.