kreuzberg 是位于 kreuzberg-dev/kreuzberg 的开源仓库,可优先按“图像与视觉工作流、MCP 与工具调用集成、开发者工程工作流”评估;仓库摘要:A polyglot document intelligence framework with a Rust core. Extract text, metadata, images, and structured information from PDFs, Office documents, images, and 97+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir, C#, R, C, TypeScript (Node/Bun/Wasm/Deno)- or use via CLI, REST API, or MCP server. 协议元数据为 Other。 GitHub 元数据显示约 8,268 Stars。 项目主页为 https://kreuzberg.dev/。
开源协议
MIT
星标
8,560
主要特性
- 核心能力:A polyglot document intelligence framework with a Rust core. Extract text, metadata, images, and structured information from PDFs, Office documents, images, and 97+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir, C#, R, C, TypeScript (Node/Bun/Wasm/Deno)- or use via CLI, REST API, or MCP server.
- 提供 MCP 或工具调用集成能力
- 支持向量检索与检索增强推理链路
- 面向代码生成、调试或工程集成场景
- 支持图像生成、编辑或视觉理解能力
- 仓库:kreuzberg-dev/kreuzberg
使用场景
- 补充检索增强或知识库工作流
- 把外部工具和系统接入 Agent 工作流
- 构建或扩展 AI 开发者工具链
- 支持视觉、媒体或多模态实验
- 作为可复用开源组件进行技术评估
- 在生产采用前比较实现成本和取舍
常见问题 FAQ
先从仓库摘要(A polyglot document intelligence framework with a Rust core. Extract text, metadata, images, and structured information from PDFs, Office documents, images, and 97+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir, C#, R, C, TypeScript (Node/Bun/Wasm/Deno)- or use via CLI, REST API, or MCP server.)判断能力边界,再核对维护状态、接入方式,以及它的“图像与视觉工作流、MCP 与工具调用集成、开发者工程工作流”定位是否匹配你的流程。仓库:https://github.com/kreuzberg-dev/kreuzberg。Stars 约 8,268。协议:Other。
kreuzberg 更适合作为“图像与视觉工作流、MCP 与工具调用集成、开发者工程工作流”方向的开源组件或参考实现来评估。典型评估场景包括:当需求是“图像与视觉工作流”,且仓库摘要匹配“A polyglot document intelligence framework with a Rust core. Extrac...”时,评估 kreuzberg。在投入内部自研前,对比 kreuzberg 的实现方式。使用 kreuzberg 在接入媒体能力前比较视觉工作流架构。