kreuzberg(kreuzberg-dev/kreuzberg)是 GitHub 开源 AI 项目。仓库描述提到:A polyglot document intelligence framework with a Rust core. Extract text, metadata, images, and structured information from PDFs, Office documents, images, and 97+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir, C#, R, C, TypeScript (Node/Bun/Wasm/Deno)- or use via CLI, REST API, or MCP server.该项目重点覆盖:MCP/工具调用集成、检索增强与向量检索、开发者工程能力、图像与视觉能力。适合基于开源仓库进行二次开发、集成与持续迭代。
开源协议
Other
星标
8,268
主要特性
- 核心能力:A polyglot document intelligence framework with a Rust core. Extract text, metadata, images, and structured information from PDFs, Office documents, images, and 97+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir, C#, R, C, TypeScript (Node/Bun/Wasm/Deno)- or use via CLI, REST API, or MCP server.
- 提供 MCP 或工具调用集成能力
- 支持向量检索与检索增强推理链路
- 面向代码生成、调试或工程集成场景
- 支持图像生成、编辑或视觉理解能力
- 仓库:kreuzberg-dev/kreuzberg
使用场景
- 把外部系统能力接入 Agent 工作流
- 构建企业知识问答与文档检索系统
- 支持研发团队构建与迭代 AI 工程链路
- 用于视觉内容生产与模型实验
- 基于 kreuzberg 构建团队内部 AI 能力原型
- 在真实业务中验证 kreuzberg 的开源工程能力
常见问题 FAQ
建议先明确要接入的能力边界与调用方式,再基于仓库能力梳理接口、参数与权限策略。GitHub 仓库地址:https://github.com/kreuzberg-dev/kreuzberg。社区关注度约 8,268 Stars。开源协议:Other。
它更适合作为业务能力封装层或执行组件,常见落地方式包括:把外部系统能力接入 Agent 工作流、构建企业知识问答与文档检索系统、支持研发团队构建与迭代 AI 工程链路。