Skip to content

CatchTheTornado 的 PDF 提取 API:使用先进 OCR 进行文档提取与解析

Published:

原文链接


CatchTheTornado 的 PDF 提取 API 是一款使用现代 OCR 和 Ollama 支持模型的文档(PDF)提取与解析工具。该 API 可以实现文档匿名化、去除个人身份信息(PII),并将任何文档或图片转换为结构化的 JSON 或 Markdown 格式。


Previous Post
软考高级架构师备考经验分享与时长分析
Next Post
Jina AI 最新开源 Meta-Prompt:提升 LLM 理解能力的实施指南