html-to-markdown(kreuzberg-dev/html-to-markdown)是 GitHub 开源 AI 项目。仓库描述提到:High performance and CommonMark compliant HTML to Markdown converter. Maintained by the Kreuzberg team. Kreuzberg is a fast, polyglot document intelligence engine with a Rust core. It extracts structured data from 56+ document formats using streaming parsers and built-in OCR.该项目重点覆盖:检索增强与向量检索、团队协作集成。适合基于开源仓库进行二次开发、集成与持续迭代。
开源协议
MIT
星标
739
主要特性
- 核心能力:High performance and CommonMark compliant HTML to Markdown converter. Maintained by the Kreuzberg team. Kreuzberg is a fast, polyglot document intelligence engine with a Rust core. It extracts structured data from 56+ document formats using streaming parsers and built-in OCR.
- 支持向量检索与检索增强推理链路
- 支持团队协作平台与业务系统集成
- 仓库:kreuzberg-dev/html-to-markdown
- 主要技术栈:HTML
- 开源协议:MIT
使用场景
- 构建企业知识问答与文档检索系统
- 用于团队知识协同与任务跟进
- 基于 html-to-markdown 构建团队内部 AI 能力原型
- 在真实业务中验证 html-to-markdown 的开源工程能力
- AI 开发流程搭建
- Agent 工作流自动化
常见问题 FAQ
建议先明确要接入的能力边界与调用方式,再基于仓库能力梳理接口、参数与权限策略。GitHub 仓库地址:https://github.com/kreuzberg-dev/html-to-markdown。社区关注度约 733 Stars。开源协议:MIT。
它更适合作为业务能力封装层或执行组件,常见落地方式包括:构建企业知识问答与文档检索系统、用于团队知识协同与任务跟进、基于 html-to-markdown 构建团队内部 AI 能力原型。