CatchTheTornado 的 PDF 提取 API：使用先进 OCR 进行文档提取与解析

2024-11-04

CatchTheTornado 的 PDF 提取 API 是一款使用现代 OCR 和 Ollama 支持模型的文档（PDF）提取与解析工具。该 API 可以实现文档匿名化、去除个人身份信息（PII），并将任何文档或图片转换为结构化的 JSON 或 Markdown 格式。