Docling 是 IBM 推出的智能文档解析转换框架,具备多格式文档解析能力,支持 PDF、DOCX、PPTX、图片、HTML、AsciiDoc 和 Markdown 等格式,可输出为 Markdown 和 JSON。它拥有高级 PDF 处理能力,能够理解页面布局、识别阅读顺序并处理表格结构,极大提升文档理解效率。
Docling:IBM 的智能文档解析转换框架,支持多格式文档解析
Published:
Docling 是 IBM 推出的智能文档解析转换框架,具备多格式文档解析能力,支持 PDF、DOCX、PPTX、图片、HTML、AsciiDoc 和 Markdown 等格式,可输出为 Markdown 和 JSON。它拥有高级 PDF 处理能力,能够理解页面布局、识别阅读顺序并处理表格结构,极大提升文档理解效率。